El genoma humano es un conjunto completo de secuencias de ácidos nucleicos para humanos , codificadas como ADN dentro de los 23 pares de cromosomas en los núcleos celulares y en una pequeña molécula de ADN que se encuentra dentro de las mitocondrias individuales . Por lo general, estos se tratan por separado como genoma nuclear y genoma mitocondrial . [2] Los genomas humanos incluyen genes de ADN que codifican proteínas y ADN no codificante . Genomas humanos haploides , que están contenidos en células germinales (el gameto del óvulo y el esperma las células creadas en la fase de meiosis de la reproducción sexual antes de que la fertilización cree un cigoto ) constan de tres mil millones de pares de bases de ADN , mientras que los genomas diploides (que se encuentran en las células somáticas ) tienen el doble de contenido de ADN. Si bien existen diferencias significativas entre los genomas de los individuos humanos (del orden del 0,1% debido a variantes de un solo nucleótido [3] y del 0,6% cuando se consideran indeles ), [4] estas son considerablemente más pequeñas que las diferencias entre los humanos y sus parientes vivos, los bonobos y los chimpancés (~ 1,1% de variantes fijas de un solo nucleótido [5] y 4% cuando se incluyen indeles). [6]
Identificación del genoma NCBI | 51 |
---|---|
Ploidía | diploide |
Tamaño del genoma | 3100 Mbp [1] (megapares de bases) por genoma haploide 6.200 Mbp en total (diploide). |
Numero de cromosomas | 23 pares |
Aunque la secuencia del genoma humano se ha determinado (casi) por completo mediante la secuenciación del ADN, todavía no se comprende por completo. La mayoría de los genes (aunque probablemente no todos) se han identificado mediante una combinación de enfoques experimentales y bioinformáticos de alto rendimiento , pero aún queda mucho trabajo por hacer para dilucidar aún más las funciones biológicas de sus productos de proteína y ARN . Los resultados recientes sugieren que la mayoría de las grandes cantidades de ADN no codificante dentro del genoma tienen actividades bioquímicas asociadas, incluida la regulación de la expresión génica , la organización de la arquitectura cromosómica y las señales que controlan la herencia epigenética .
Antes de la adquisición de la secuencia completa del genoma, las estimaciones del número de genes humanos oscilaban entre 50.000 y 140.000 (con vaguedad ocasional sobre si estas estimaciones incluían genes que no codifican proteínas). [7] A medida que mejoraron la calidad de la secuencia del genoma y los métodos para identificar genes codificadores de proteínas, [8] el recuento de genes codificadores de proteínas reconocidos se redujo a 19.000-20.000. [9] Sin embargo, una comprensión más completa de la función desempeñada por secuencias que no lo hacen codifican proteínas, pero en lugar de expresar ARN regulador, se ha elevado el número total de genes de al menos 46.831, [10] más otros 2300 micro-ARN genes. [11] Para 2012, se han observado elementos funcionales de ADN que no codifican ni ARN ni proteínas. [12] Una encuesta de población de 2018 encontró otros 300 millones de bases del genoma humano que no estaban en la secuencia de referencia. [13]
Las secuencias codificantes de proteínas representan solo una fracción muy pequeña del genoma (aproximadamente 1,5%), y el resto está asociado con genes de ARN no codificantes , secuencias de ADN reguladoras , LINE , SINE , intrones y secuencias para las que aún no tienen función. ha sido determinado. [14]
Secuenciación
Las primeras secuencias del genoma humano fueron publicadas en forma de borrador casi completo en febrero de 2001 por el Proyecto Genoma Humano [15] y Celera Corporation . [16] La finalización del esfuerzo de secuenciación del Proyecto del Genoma Humano se anunció en 2004 con la publicación de un borrador de la secuencia del genoma, dejando solo 341 espacios en la secuencia, lo que representa ADN altamente repetitivo y de otro tipo que no se pudo secuenciar con la tecnología disponible en el hora. [8] El genoma humano fue el primero de todos los vertebrados en ser secuenciado casi hasta su finalización y, a partir de 2018, los genomas diploides de más de un millón de humanos individuales se habían determinado mediante secuenciación de próxima generación . [17] En 2021 se informó que el consorcio T2T había llenado todos los vacíos. Así nació un genoma humano completo sin lagunas. [18]
Estos datos se utilizan en todo el mundo en ciencias biomédicas , antropología , medicina forense y otras ramas de la ciencia. Estos estudios genómicos han dado lugar a avances en el diagnóstico y tratamiento de enfermedades y a nuevos conocimientos en muchos campos de la biología, incluida la evolución humana .
En junio de 2016, los científicos anunciaron formalmente HGP-Write , un plan para sintetizar el genoma humano. [19] [20]
Lo completo
Aunque la "finalización" del proyecto del genoma humano se anunció en 2001, [14] quedaron cientos de lagunas, con aproximadamente un 5-10% de la secuencia total sin determinar. La información genética faltante se encontraba principalmente en regiones heterocromáticas repetitivas y cerca de los centrómeros y telómeros , pero también en algunas regiones eucromáticas que codifican genes . [21] Quedaron 160 lagunas eucromáticas en 2015 cuando se determinaron las secuencias que abarcan otras 50 regiones no secuenciadas anteriormente. [22] Sólo en 2020 fue la primera verdaderamente completa secuencia-telómero-a de los telómeros de un cromosoma humano determinado, a saber, del cromosoma X . [23]
Organización molecular y contenido genético
La longitud total del genoma de referencia humano , que no representa la secuencia de ningún individuo específico, supera los 3 mil millones de pares de bases. El genoma está organizado en 22 cromosomas pareados, denominados autosomas , más el par 23 de cromosomas sexuales (XX) en la hembra y (XY) en el macho. Todas estas son moléculas de ADN lineales grandes contenidas dentro del núcleo celular. El genoma también incluye el ADN mitocondrial , una molécula circular comparativamente pequeña presente en múltiples copias en cada mitocondria .
Cromosoma | Longitud ( mm ) | Pares de bases | Variaciones | En proteínas de codificación de genes | pseudo- genes | NcRNA largo total | NcRNA pequeño total | miARN | ARNr | snRNA | snoRNA | Varios ncRNA | Enlaces | Posición del centrómero ( Mbp ) | Acumulado (%) |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 | 85 | 248,956,422 | 12,151,146 | 2058 | 1220 | 1200 | 496 | 134 | 66 | 221 | 145 | 192 | EBI | 125 | 7,9 |
2 | 83 | 242,193,529 | 12,945,965 | 1309 | 1023 | 1037 | 375 | 115 | 40 | 161 | 117 | 176 | EBI | 93,3 | 16,2 |
3 | 67 | 198,295,559 | 10,638,715 | 1078 | 763 | 711 | 298 | 99 | 29 | 138 | 87 | 134 | EBI | 91 | 23 |
4 | sesenta y cinco | 190,214,555 | 10.165.685 | 752 | 727 | 657 | 228 | 92 | 24 | 120 | 56 | 104 | EBI | 50,4 | 29,6 |
5 | 62 | 181,538,259 | 9.519.995 | 876 | 721 | 844 | 235 | 83 | 25 | 106 | 61 | 119 | EBI | 48,4 | 35,8 |
6 | 58 | 170,805,979 | 9.130.476 | 1048 | 801 | 639 | 234 | 81 | 26 | 111 | 73 | 105 | EBI | 61 | 41,6 |
7 | 54 | 159,345,973 | 8,613,298 | 989 | 885 | 605 | 208 | 90 | 24 | 90 | 76 | 143 | EBI | 59,9 | 47,1 |
8 | 50 | 145,138,636 | 8.221.520 | 677 | 613 | 735 | 214 | 80 | 28 | 86 | 52 | 82 | EBI | 45,6 | 52 |
9 | 48 | 138,394,717 | 6.590.811 | 786 | 661 | 491 | 190 | 69 | 19 | 66 | 51 | 96 | EBI | 49 | 56,3 |
10 | 46 | 133,797,422 | 7.223.944 | 733 | 568 | 579 | 204 | 64 | 32 | 87 | 56 | 89 | EBI | 40,2 | 60,9 |
11 | 46 | 135,086,622 | 7.535.370 | 1298 | 821 | 710 | 233 | 63 | 24 | 74 | 76 | 97 | EBI | 53,7 | 65,4 |
12 | 45 | 133,275,309 | 7.228.129 | 1034 | 617 | 848 | 227 | 72 | 27 | 106 | 62 | 115 | EBI | 35,8 | 70 |
13 | 39 | 114,364,328 | 5,082,574 | 327 | 372 | 397 | 104 | 42 | dieciséis | 45 | 34 | 75 | EBI | 17,9 | 73,4 |
14 | 36 | 107,043,718 | 4.865.950 | 830 | 523 | 533 | 239 | 92 | 10 | sesenta y cinco | 97 | 79 | EBI | 17,6 | 76,4 |
15 | 35 | 101.991.189 | 4.515.076 | 613 | 510 | 639 | 250 | 78 | 13 | 63 | 136 | 93 | EBI | 19 | 79,3 |
dieciséis | 31 | 90,338,345 | 5.101.702 | 873 | 465 | 799 | 187 | 52 | 32 | 53 | 58 | 51 | EBI | 36,6 | 82 |
17 | 28 | 83,257,441 | 4.614.972 | 1197 | 531 | 834 | 235 | 61 | 15 | 80 | 71 | 99 | EBI | 24 | 84,8 |
18 | 27 | 80,373,285 | 4.035.966 | 270 | 247 | 453 | 109 | 32 | 13 | 51 | 36 | 41 | EBI | 17.2 | 87,4 |
19 | 20 | 58,617,616 | 3.858.269 | 1472 | 512 | 628 | 179 | 110 | 13 | 29 | 31 | 61 | EBI | 26,5 | 89,3 |
20 | 21 | 64,444,167 | 3,439,621 | 544 | 249 | 384 | 131 | 57 | 15 | 46 | 37 | 68 | EBI | 27,5 | 91,4 |
21 | dieciséis | 46,709,983 | 2,049,697 | 234 | 185 | 305 | 71 | dieciséis | 5 | 21 | 19 | 24 | EBI | 13,2 | 92,6 |
22 | 17 | 50,818,468 | 2,135,311 | 488 | 324 | 357 | 78 | 31 | 5 | 23 | 23 | 62 | EBI | 14,7 | 93,8 |
X | 53 | 156,040,895 | 5.753.881 | 842 | 874 | 271 | 258 | 128 | 22 | 85 | 64 | 100 | EBI | 60,6 | 99,1 |
Y | 20 | 57,227,415 | 211,643 | 71 | 388 | 71 | 30 | 15 | 7 | 17 | 3 | 8 | EBI | 10,4 | 100 |
ADNmt | 0,0054 | 16,569 | 929 | 13 | 0 | 0 | 24 | 0 | 2 | 0 | 0 | 0 | EBI | N / A | 100 |
total | 3,088,286,401 | 155,630,645 | 20412 | 14600 | 14727 | 5037 | 1756 | 532 | 1944 | 1521 | 2213 |
Análisis original publicado en la base de datos Ensembl del Instituto Europeo de Bioinformática (EBI) y del Wellcome Trust Sanger Institute . Longitudes de cromosomas estimadas multiplicando el número de pares de bases por 0,34 nanómetros (distancia entre pares de bases en la estructura más común de la doble hélice de ADN ; una estimación reciente de las longitudes de cromosomas humanos basada en datos actualizados reporta 205,00 cm para el genoma masculino diploide y 208,23 cm para las hembras, correspondientes a pesos de 6,41 y 6,51 picogramos (pg), respectivamente [25] ). El número de proteínas se basa en el número de transcripciones de ARNm precursoras iniciales y no incluye productos de empalme alternativo de ARNm previo ni modificaciones en la estructura de la proteína que se producen después de la traducción .
Las variaciones son diferencias únicas en la secuencia de ADN que se han identificado en las secuencias del genoma humano individual analizadas por Ensembl en diciembre de 2016. Se espera que el número de variaciones identificadas aumente a medida que se secuencian y analizan más genomas personales . Además del contenido de genes que se muestra en esta tabla, se ha identificado un gran número de secuencias funcionales no expresadas en todo el genoma humano (ver más abajo). Vincula ventanas abiertas a las secuencias de cromosomas de referencia en el navegador del genoma de EBI.
Los ARN pequeños no codificantes son ARN de hasta 200 bases que no tienen potencial de codificación de proteínas. Estos incluyen: microARN o miARN (reguladores postranscripcionales de la expresión génica), ARN nucleares pequeños o ARNsn (los componentes de ARN de los espliceosomas ) y ARN nucleolares pequeños o ARNsno (que participan en la guía de modificaciones químicas de otras moléculas de ARN). Los ARN largos no codificantes son moléculas de ARN de más de 200 bases que no tienen potencial de codificación de proteínas. Estos incluyen: ARN ribosómico o ARNr (los componentes de ARN de los ribosomas ) y una variedad de otros ARN largos que participan en la regulación de la expresión génica , modificaciones epigenéticas de nucleótidos de ADN y proteínas histonas , y regulación de la actividad de codificación de proteínas. genes. Pequeñas discrepancias entre los números de ncRNA pequeños totales y los números de tipos específicos de ncNRA pequeños son el resultado de que los primeros valores provienen de la versión 87 de Ensembl y el último de la versión 68 de Ensembl.
El número de genes en el genoma humano no está del todo claro porque la función de numerosas transcripciones sigue sin estar clara. Esto es especialmente cierto para el ARN no codificante . El número de genes que codifican proteínas se conoce mejor, pero todavía hay del orden de 1.400 genes cuestionables que pueden o no codificar proteínas funcionales, generalmente codificadas por marcos de lectura abiertos cortos .
Gencode [27] | Conjunto [28] | Refseq [29] | AJEDREZ [30] | |
---|---|---|---|---|
genes que codifican proteínas | 19,901 | 20,376 | 20,345 | 21.306 |
genes de lncRNA | 15,779 | 14,720 | 17,712 | 18,484 |
ARN antisentido | 5501 | 28 | 2694 | |
ARN misceláneo | 2213 | 2222 | 13,899 | 4347 |
Pseudogenes | 14,723 | 1740 | 15.952 | |
transcripciones totales | 203,835 | 203,903 | 154,484 | 328,827 |
Contenido de informacion
El genoma humano haploide (23 cromosomas ) tiene aproximadamente 3 mil millones de pares de bases y contiene alrededor de 30,000 genes. [31] Dado que cada par de bases se puede codificar con 2 bits, esto equivale a unos 750 megabytes de datos. Una célula somática ( diploide ) individual contiene el doble de esta cantidad, es decir, alrededor de 6 mil millones de pares de bases. Los hombres tienen menos que las mujeres porque el cromosoma Y tiene alrededor de 57 millones de pares de bases, mientras que el X tiene alrededor de 156 millones. Dado que los genomas individuales varían en secuencia en menos del 1% entre sí, las variaciones del genoma de un humano dado a partir de una referencia común pueden comprimirse sin pérdidas a aproximadamente 4 megabytes. [32]
La tasa de entropía del genoma difiere significativamente entre secuencias codificantes y no codificantes. Está cerca del máximo de 2 bits por par de bases para las secuencias de codificación (alrededor de 45 millones de pares de bases), pero menos para las partes no codificantes. Varía entre 1,5 y 1,9 bits por par de bases para el cromosoma individual, a excepción del cromosoma Y, que tiene una tasa de entropía por debajo de 0,9 bits por par de bases. [33]
ADN codificante frente a no codificante
El contenido del genoma humano se divide comúnmente en secuencias de ADN codificantes y no codificantes. El ADN codificante se define como aquellas secuencias que pueden transcribirse en ARNm y traducirse en proteínas durante el ciclo de vida humano; estas secuencias ocupan solo una pequeña fracción del genoma (<2%). El ADN no codificante está formado por todas esas secuencias (aproximadamente el 98% del genoma) que no se utilizan para codificar proteínas.
Algunos ADN no codificantes contienen genes para moléculas de ARN con funciones biológicas importantes ( ARN no codificantes , por ejemplo, ARN ribosómico y ARN de transferencia ). La exploración de la función y el origen evolutivo del ADN no codificante es un objetivo importante de la investigación del genoma contemporáneo, incluido el proyecto ENCODE (Encyclopedia of DNA Elements), que tiene como objetivo estudiar todo el genoma humano, utilizando una variedad de herramientas experimentales cuyos resultados son indicativos. de actividad molecular.
Dado que el ADN no codificante supera en gran medida al ADN codificante, el concepto de genoma secuenciado se ha convertido en un concepto analítico más centrado que el concepto clásico del gen que codifica el ADN. [34] [35]
Secuencias codificantes (genes codificadores de proteínas)
Las secuencias codificantes de proteínas representan el componente más estudiado y mejor entendido del genoma humano. En última instancia, estas secuencias conducen a la producción de todas las proteínas humanas , aunque varios procesos biológicos (por ejemplo, reordenamientos del ADN y empalme alternativo de pre-ARNm ) pueden conducir a la producción de muchas más proteínas únicas que el número de genes que codifican proteínas. La capacidad modular completa de codificación de proteínas del genoma está contenida dentro del exoma y consta de secuencias de ADN codificadas por exones que pueden traducirse en proteínas. Debido a su importancia biológica y al hecho de que constituye menos del 2% del genoma, la secuenciación del exoma fue el primer hito importante del Proyecto Genoma Humano.
Número de genes que codifican proteínas . Se han anotado alrededor de 20.000 proteínas humanas en bases de datos como Uniprot . [37] Históricamente, las estimaciones para el número de genes de proteínas han variado ampliamente, llegando a 2,000,000 a fines de la década de 1960, [38] pero varios investigadores señalaron a principios de la década de 1970 que la carga mutacional estimada de mutaciones deletéreas colocaba un límite superior de aproximadamente 40.000 para el número total de loci funcionales (esto incluye genes codificantes de proteínas y no codificantes funcionales). [39] El número de genes que codifican proteínas humanas no es significativamente mayor que el de muchos organismos menos complejos, como el gusano redondo y la mosca de la fruta . Esta diferencia puede resultar del uso extensivo de empalme de pre-ARNm alternativo en humanos, que proporciona la capacidad de construir una gran cantidad de proteínas modulares mediante la incorporación selectiva de exones.
Capacidad de codificación de proteínas por cromosoma . Los genes que codifican proteínas se distribuyen de manera desigual en los cromosomas, desde unas pocas docenas hasta más de 2000, con una densidad genética especialmente alta en los cromosomas 1, 11 y 19. Cada cromosoma contiene varias regiones ricas y pobres en genes, que puede estar correlacionado con bandas de cromosomas y contenido de GC . [40] No se comprende bien la importancia de estos patrones no aleatorios de densidad genética. [41]
Tamaño de los genes que codifican proteínas . El tamaño de los genes que codifican proteínas dentro del genoma humano muestra una enorme variabilidad. Por ejemplo, el gen de la histona H1a (HIST1HIA) es relativamente pequeño y simple, carece de intrones y codifica un ARNm de 781 nucleótidos de longitud que produce una proteína de 215 aminoácidos a partir de su marco de lectura abierto de 648 nucleótidos . La distrofina (DMD) fue el gen codificador de proteínas más grande en el genoma de referencia humano de 2001, que abarca un total de 2,2 millones de nucleótidos, [42] mientras que un metanálisis sistemático más reciente de datos actualizados del genoma humano identificó un gen codificador de proteínas aún más grande, RBFOX1 (proteína de unión a ARN, homólogo 1 de fox-1), que abarca un total de 2,47 millones de nucleótidos. [43] La titina (TTN) tiene la secuencia codificante más larga (114,414 nucleótidos), el mayor número de exones (363), [42] y el exón único más largo (17,106 nucleótidos). Según las estimaciones basadas en un conjunto curado de genes que codifican proteínas en todo el genoma, el tamaño medio es de 26.288 nucleótidos (media = 66.577), el tamaño medio del exón, 133 nucleótidos (media = 309), el número medio de exones, 8 ( media = 11), y la proteína codificada mediana tiene 425 aminoácidos (media = 553) de longitud. [43]
Proteína | Crom | Gene | Largo | Exones | Longitud del exón | Longitud del intrón | Empalme alternativo |
---|---|---|---|---|---|---|---|
Proteína de susceptibilidad al cáncer de mama tipo 2 | 13 | BRCA2 | 83,736 | 27 | 11,386 | 72,350 | sí |
Fibrosis quística regulador de la conductancia transmembrana | 7 | CFTR | 202,881 | 27 | 4.440 | 198,441 | sí |
Citocromo b | MONTE | MTCYB | 1,140 | 1 | 1,140 | 0 | No |
Distrofina | X | DMD | 2,220,381 | 79 | 10,500 | 2.209.881 | sí |
Gliceraldehído-3-fosfato deshidrogenasa | 12 | GAPDH | 4.444 | 9 | 1.425 | 3,019 | sí |
Subunidad beta de hemoglobina | 11 | HBB | 1,605 | 3 | 626 | 979 | No |
Histona H1A | 6 | HIST1H1A | 781 | 1 | 781 | 0 | No |
Titin | 2 | TTN | 281,434 | 364 | 104.301 | 177,133 | sí |
ADN no codificante (ncDNA)
El ADN no codificante se define como todas las secuencias de ADN dentro de un genoma que no se encuentran dentro de los exones que codifican proteínas y, por lo tanto, nunca están representadas dentro de la secuencia de aminoácidos de las proteínas expresadas. Según esta definición, más del 98% de los genomas humanos está compuesto por ncDNA.
Se han identificado numerosas clases de ADN no codificante, incluidos genes para ARN no codificante (p. Ej., ARNt y ARNr), pseudogenes, intrones, regiones no traducidas de ARNm, secuencias reguladoras de ADN, secuencias repetitivas de ADN y secuencias relacionadas con elementos genéticos móviles.
Numerosas secuencias que se incluyen dentro de los genes también se definen como ADN no codificante. Estos incluyen genes para ARN no codificante (por ejemplo, ARNt, ARNr) y componentes no traducidos de genes que codifican proteínas (por ejemplo, intrones y regiones no traducidas 5 'y 3' de ARNm).
Las secuencias codificantes de proteínas (específicamente, exones codificantes ) constituyen menos del 1,5% del genoma humano. [14] Además, alrededor del 26% del genoma humano son intrones . [45] Aparte de los genes (exones e intrones) y secuencias reguladoras conocidas (8-20%), el genoma humano contiene regiones de ADN no codificante. La cantidad exacta de ADN no codificante que juega un papel en la fisiología celular ha sido objeto de acalorados debates. Un análisis reciente del proyecto ENCODE indica que el 80% de todo el genoma humano se transcribe, se une a proteínas reguladoras o está asociado con alguna otra actividad bioquímica. [12]
Sin embargo, sigue siendo controvertido si toda esta actividad bioquímica contribuye a la fisiología celular, o si una parte sustancial de esto es el resultado de ruido transcripcional y bioquímico, que el organismo debe filtrar activamente. [46] Excluyendo las secuencias codificantes de proteínas, los intrones y las regiones reguladoras, gran parte del ADN no codificante se compone de: Muchas secuencias de ADN que no juegan un papel en la expresión génica tienen funciones biológicas importantes. Los estudios de genómica comparativa indican que alrededor del 5% del genoma contiene secuencias de ADN no codificante que están muy conservadas , a veces en escalas de tiempo que representan cientos de millones de años, lo que implica que estas regiones no codificantes están bajo una fuerte presión evolutiva y selección positiva . [47]
Muchas de estas secuencias regulan la estructura de los cromosomas limitando las regiones de formación de heterocromatina y regulando las características estructurales de los cromosomas, como los telómeros y centrómeros . Otras regiones no codificantes sirven como orígenes de la replicación del ADN . Finalmente, varias regiones se transcriben en ARN funcional no codificante que regula la expresión de genes que codifican proteínas (por ejemplo [48] ), traducción y estabilidad del ARNm (ver miARN ), estructura de cromatina (incluidas modificaciones de histonas , por ejemplo [49] ), ADN metilación (por ejemplo [50] ), recombinación de ADN (por ejemplo [51] ) y regulación cruzada de otros ARN no codificantes (por ejemplo [52] ). También es probable que muchas regiones no codificantes transcritas no desempeñen ningún papel y que esta transcripción sea el producto de la actividad de la ARN polimerasa no específica . [46]
Pseudogenes
Los pseudogenes son copias inactivas de genes que codifican proteínas, a menudo generados por duplicación de genes , que se han vuelto no funcionales debido a la acumulación de mutaciones inactivadoras. El número de pseudogenes en el genoma humano es del orden de 13.000, [53] y en algunos cromosomas es casi el mismo que el número de genes codificantes de proteínas funcionales. La duplicación de genes es un mecanismo importante a través del cual se genera nuevo material genético durante la evolución molecular .
Por ejemplo, la familia de genes del receptor olfatorio es uno de los ejemplos mejor documentados de pseudogenes en el genoma humano. Más del 60 por ciento de los genes de esta familia son pseudogenes no funcionales en humanos. En comparación, sólo el 20 por ciento de los genes de la familia de genes del receptor olfativo de ratón son pseudogenes. La investigación sugiere que esta es una característica específica de la especie, ya que los primates más estrechamente relacionados tienen proporcionalmente menos pseudogenes. Este descubrimiento genético ayuda a explicar el sentido del olfato menos agudo en los humanos en relación con otros mamíferos. [54]
Genes para ARN no codificante (ncRNA)
Las moléculas de ARN no codificantes desempeñan muchas funciones esenciales en las células, especialmente en las numerosas reacciones de síntesis de proteínas y procesamiento de ARN . El ARN no codificante incluye ARNt , ARN ribosómico , microARN , ARNnn y otros genes de ARN no codificante, incluidos aproximadamente 60.000 ARN largos no codificantes (lncRNA). [12] [55] [56] [57] Aunque el número de genes de lncRNA informados continúa aumentando y el número exacto en el genoma humano aún no se ha definido, se argumenta que muchos de ellos no son funcionales. [58]
Muchos ncRNA son elementos críticos en la regulación y expresión de genes. El ARN no codificante también contribuye a la epigenética, la transcripción, el empalme de ARN y la maquinaria de traducción. El papel del ARN en la regulación genética y la enfermedad ofrece un nuevo nivel potencial de complejidad genómica inexplorada. [59]
Intrones y regiones no traducidas de ARNm
Además de las moléculas de ncRNA que están codificadas por genes discretos, las transcripciones iniciales de genes codificantes de proteínas generalmente contienen secuencias no codificantes extensas, en forma de intrones , regiones 5 'sin traducir (5'-UTR) y regiones 3' sin traducir (3'-UTR). Dentro de la mayoría de los genes que codifican proteínas del genoma humano, la longitud de las secuencias de intrones es de 10 a 100 veces la longitud de las secuencias de exones.
Secuencias de ADN reguladoras
El genoma humano tiene muchas secuencias reguladoras diferentes que son cruciales para controlar la expresión génica . Las estimaciones conservadoras indican que estas secuencias constituyen el 8% del genoma, [60] sin embargo, las extrapolaciones del proyecto ENCODE dan que el 20 [61] -40% [62] del genoma es una secuencia reguladora de genes. Algunos tipos de ADN no codificante son "interruptores" genéticos que no codifican proteínas, pero sí regulan cuándo y dónde se expresan los genes (llamados potenciadores ). [63]
Las secuencias reguladoras se conocen desde finales de la década de 1960. [64] La primera identificación de secuencias reguladoras en el genoma humano se basó en la tecnología del ADN recombinante. [65] Más tarde, con el advenimiento de la secuenciación genómica, la identificación de estas secuencias podría inferirse por conservación evolutiva. La rama evolutiva entre los primates y el ratón , por ejemplo, se produjo hace 70 a 90 millones de años. [66] Por lo tanto, las comparaciones por computadora de secuencias de genes que identifican secuencias no codificantes conservadas serán una indicación de su importancia en tareas como la regulación de genes. [67]
Se han secuenciado otros genomas con la misma intención de ayudar a los métodos guiados por la conservación, por ejemplo, el genoma del pez globo . [68] Sin embargo, las secuencias reguladoras desaparecen y vuelven a evolucionar durante la evolución a un ritmo elevado. [69] [70] [71]
A partir de 2012, los esfuerzos se han orientado a encontrar interacciones entre el ADN y las proteínas reguladoras mediante la técnica ChIP-Seq , o espacios donde el ADN no está empaquetado por histonas ( sitios hipersensibles a la ADNasa ), los cuales indican dónde hay secuencias reguladoras activas en el tipo de célula investigado. [60]
Secuencias de ADN repetitivas
Las secuencias de ADN repetitivas comprenden aproximadamente el 50% del genoma humano. [72]
Aproximadamente el 8% del genoma humano consiste en matrices de ADN en tándem o repeticiones en tándem, secuencias repetidas de baja complejidad que tienen múltiples copias adyacentes (por ejemplo, "CAGCAGCAG ..."). [73] Las secuencias en tándem pueden tener longitudes variables, desde dos nucleótidos hasta decenas de nucleótidos. Estas secuencias son muy variables, incluso entre individuos estrechamente relacionados, por lo que se utilizan para pruebas de ADN genealógico y análisis forense de ADN . [74]
Las secuencias repetidas de menos de diez nucleótidos (por ejemplo, la repetición de dinucleótidos (AC) n ) se denominan secuencias de microsatélites. Entre las secuencias de microsatélites, las repeticiones de trinucleótidos son de particular importancia, ya que a veces ocurren dentro de las regiones codificantes de genes para proteínas y pueden conducir a trastornos genéticos. Por ejemplo, la enfermedad de Huntington es el resultado de una expansión de la repetición de trinucleótidos (CAG) n dentro del gen Huntingtin en el cromosoma humano 4. Los telómeros (los extremos de los cromosomas lineales) terminan con una repetición de hexanucleótidos microsatélites de la secuencia (TTAGGG) n .
Las repeticiones en tándem de secuencias más largas (matrices de secuencias repetidas de 10 a 60 nucleótidos de longitud) se denominan minisatélites .
Elementos genéticos móviles (transposones) y sus reliquias
Los elementos genéticos transponibles , secuencias de ADN que pueden replicarse e insertar copias de sí mismos en otras ubicaciones dentro del genoma del huésped, son un componente abundante en el genoma humano. El linaje de transposones más abundante, Alu , tiene alrededor de 50.000 copias activas [75] y puede insertarse en regiones intragénicas e intergénicas. [76] Otro linaje, LINE-1, tiene alrededor de 100 copias activas por genoma (el número varía entre personas). [77] Junto con las reliquias no funcionales de viejos transposones, representan más de la mitad del ADN humano total. [78] A veces llamados "genes saltarines", los transposones han desempeñado un papel importante en la escultura del genoma humano. Algunas de estas secuencias representan retrovirus endógenos , copias de ADN de secuencias virales que se han integrado permanentemente en el genoma y ahora se transmiten a las generaciones siguientes.
Los elementos móviles dentro del genoma humano se pueden clasificar en retrotransposones LTR (8,3% del genoma total), SINE (13,1% del genoma total), incluidos elementos Alu , LINE (20,4% del genoma total), SVA y transposones de ADN de clase II (2,9%). del genoma total).
Variación genómica en humanos
Genoma de referencia humano
Con la excepción de los gemelos idénticos, todos los seres humanos muestran una variación significativa en las secuencias de ADN genómico. El genoma de referencia humano (HRG) se utiliza como referencia de secuencia estándar.
Hay varios puntos importantes relacionados con el genoma de referencia humano:
- La HRG es una secuencia haploide. Cada cromosoma está representado una vez.
- La HRG es una secuencia compuesta y no corresponde a ningún individuo humano real.
- El HRG se actualiza periódicamente para corregir errores, ambigüedades y "lagunas" desconocidas.
- El HRG de ninguna manera representa un individuo humano "ideal" o "perfecto". Es simplemente una representación o modelo estandarizado que se utiliza con fines comparativos.
El Consorcio de Referencia del Genoma es responsable de actualizar el HRG. La versión 38 se publicó en diciembre de 2013. [79]
Midiendo la variación genética humana
La mayoría de los estudios de variación genética humana se han centrado en polimorfismos de un solo nucleótido (SNP), que son sustituciones en bases individuales a lo largo de un cromosoma. La mayoría de los análisis estiman que los SNP ocurren 1 de cada 1000 pares de bases, en promedio, en el genoma humano eucromático , aunque no ocurren con una densidad uniforme. Así sigue la afirmación popular de que "todos, independientemente de la raza , genéticamente 99,9% iguales", [80] aunque esto sería algo calificado por la mayoría de los genetistas. Por ejemplo, ahora se cree que una fracción mucho mayor del genoma está involucrada en la variación del número de copias . [81] El Proyecto Internacional HapMap está llevando a cabo un esfuerzo de colaboración a gran escala para catalogar las variaciones de SNP en el genoma humano .
Los loci genómicos y la longitud de ciertos tipos de pequeñas secuencias repetitivas varían mucho de una persona a otra, lo cual es la base de las tecnologías de huellas dactilares de ADN y pruebas de paternidad de ADN . Los heterocromáticas porciones del genoma humano, que ascienden a varios cientos de millones de pares de bases, también se cree que ser bastante variable dentro de la población humana (que son tan repetitivo y tanto tiempo que no se pueden secuenciar con precisión con la tecnología actual). Estas regiones contienen pocos genes y no está claro si algún efecto fenotípico significativo resulta de una variación típica en las repeticiones o heterocromatina.
La mayoría de las mutaciones genómicas macroscópicas en las células germinales de gametos probablemente dan lugar a embriones inviables; sin embargo, varias enfermedades humanas están relacionadas con anomalías genómicas a gran escala. El síndrome de Down , el síndrome de Turner y una serie de otras enfermedades son el resultado de la no disyunción de cromosomas completos. Las células cancerosas con frecuencia tienen aneuploidía de cromosomas y brazos cromosómicos, aunque no se ha establecido una relación de causa y efecto entre aneuploidía y cáncer.
Mapeo de la variación genómica humana
Mientras que una secuencia del genoma enumera el orden de cada base de ADN en un genoma, un mapa del genoma identifica los puntos de referencia. Un mapa del genoma es menos detallado que una secuencia del genoma y ayuda a navegar por el genoma. [82] [83]
Un ejemplo de mapa de variación es el HapMap que está desarrollando el Proyecto Internacional HapMap . El HapMap es un mapa de haplotipos del genoma humano, "que describirá los patrones comunes de variación de la secuencia del ADN humano". [84] Cataloga los patrones de variaciones a pequeña escala en el genoma que involucran letras o bases de ADN individuales.
Los investigadores publicaron el primer mapa basado en secuencias de variación estructural a gran escala en el genoma humano en la revista Nature en mayo de 2008. [85] [86] Las variaciones estructurales a gran escala son diferencias en el genoma entre personas que van desde unos pocos miles a unos pocos millones de bases de ADN; algunas son ganancias o pérdidas de tramos de la secuencia del genoma y otras aparecen como reordenamientos de tramos de secuencia. Estas variaciones incluyen diferencias en el número de copias que los individuos tienen de un gen particular, deleciones, translocaciones e inversiones.
Frecuencia de SNP en todo el genoma humano
Los polimorfismos de un solo nucleótido (SNP) no ocurren de manera homogénea en todo el genoma humano. De hecho, existe una enorme diversidad en la frecuencia de SNP entre genes, lo que refleja diferentes presiones selectivas en cada gen, así como diferentes tasas de mutación y recombinación en todo el genoma. Sin embargo, los estudios sobre SNP están sesgados hacia regiones codificantes, es poco probable que los datos generados a partir de ellos reflejen la distribución general de SNP en todo el genoma. Por lo tanto, el protocolo del SNP Consortium se diseñó para identificar SNP sin sesgo hacia las regiones codificantes y los 100.000 SNP del Consorcio generalmente reflejan la diversidad de secuencias en los cromosomas humanos. El SNP Consortium tiene como objetivo ampliar el número de SNP identificados en todo el genoma a 300 000 para fines del primer trimestre de 2001. [87]
Los cambios en la secuencia no codificante y los cambios sinónimos en la secuencia codificante son generalmente más comunes que los cambios no sinónimos, lo que refleja una mayor diversidad de reducción de la presión selectiva en las posiciones que dictan la identidad de los aminoácidos. Los cambios de transición son más comunes que las transversiones, y los dinucleótidos CpG muestran la tasa de mutación más alta, presumiblemente debido a la desaminación.
Genomas personales
Una secuencia del genoma personal es un (casi) completa secuencia de los pares de bases químicas que componen el ADN de una sola persona. Debido a que los tratamientos médicos tienen diferentes efectos en diferentes personas debido a variaciones genéticas como los polimorfismos de un solo nucleótido (SNP), el análisis de genomas personales puede conducir a un tratamiento médico personalizado basado en genotipos individuales. [88]
La primera secuencia del genoma personal que se determinó fue la de Craig Venter en 2007. Los genomas personales no se habían secuenciado en el Proyecto Genoma Humano público para proteger la identidad de los voluntarios que proporcionaron muestras de ADN. Esa secuencia se derivó del ADN de varios voluntarios de una población diversa. [89] Sin embargo, al principio del esfuerzo de secuenciación del genoma de Celera Genomics dirigido por Venter, se tomó la decisión de cambiar de secuenciar una muestra compuesta a usar ADN de un solo individuo, que luego se reveló que había sido el propio Venter. Por lo tanto, la secuencia del genoma humano de Celera publicada en 2000 fue en gran parte la de un hombre. El reemplazo posterior de los primeros datos derivados de compuestos y la determinación de la secuencia diploide, que representa ambos conjuntos de cromosomas , en lugar de una secuencia haploide informada originalmente, permitió la liberación del primer genoma personal. [90] En abril de 2008, también se completó el de James Watson . En 2009, Stephen Quake publicó su propia secuencia de genoma derivada de un secuenciador de su propio diseño, el Heliscope. [91] Un equipo de Stanford dirigido por Euan Ashley publicó un marco para la interpretación médica de los genomas humanos implementado en el genoma de Quake y tomó decisiones médicas basadas en el genoma completo por primera vez. [92] Ese equipo amplió aún más el enfoque a la familia West, la primera familia secuenciada como parte del programa de secuenciación del genoma personal de Illumina. [93] Desde entonces se han publicado cientos de secuencias genómicas personales, [94] incluidas las de Desmond Tutu , [95] [96] y de un Paleo-Eskimo . [97] En 2012, se hicieron públicas las secuencias del genoma completo de dos tríos familiares entre 1092 genomas. [3] En noviembre de 2013, una familia española puso a disposición del público cuatro conjuntos de datos de exomas personales (alrededor del 1% del genoma) bajo una licencia de dominio público de Creative Commons . [98] [99] El Proyecto Genoma Personal (iniciado en 2005) se encuentra entre los pocos que ponen a disposición del público tanto las secuencias del genoma como los fenotipos médicos correspondientes. [100] [101]
La secuenciación de genomas individuales reveló niveles de complejidad genética que no se habían apreciado antes. La genómica personal ayudó a revelar el nivel significativo de diversidad en el genoma humano atribuido no solo a los SNP sino también a las variaciones estructurales. Sin embargo, la aplicación de tal conocimiento al tratamiento de enfermedades y en el campo médico está solo en sus inicios. [102] La secuenciación del exoma se ha vuelto cada vez más popular como una herramienta para ayudar en el diagnóstico de enfermedades genéticas porque el exoma contribuye solo con el 1% de la secuencia genómica pero representa aproximadamente el 85% de las mutaciones que contribuyen significativamente a la enfermedad. [103]
Nocauts humanos
En los seres humanos, los knockouts de genes ocurren naturalmente como knockouts de genes heterocigotos u homocigotos con pérdida de función . Estos nocauts son a menudo difíciles de distinguir, especialmente dentro de antecedentes genéticos heterogéneos . También son difíciles de encontrar ya que ocurren en bajas frecuencias.
Las poblaciones con altas tasas de consanguinidad , como los países con altas tasas de matrimonios entre primos hermanos, muestran las frecuencias más altas de knockouts de genes homocigotos. Dichas poblaciones incluyen a las poblaciones de Pakistán, Islandia y Amish. Estas poblaciones con un alto nivel de parentesco han sido objeto de una investigación de knock out en humanos que ha ayudado a determinar la función de genes específicos en humanos. Al distinguir knockouts específicos, los investigadores pueden utilizar análisis fenotípicos de estos individuos para ayudar a caracterizar el gen que ha sido eliminado.
Los knockouts en genes específicos pueden causar enfermedades genéticas, potencialmente tener efectos beneficiosos o incluso resultar en ningún efecto fenotípico. Sin embargo, determinar el efecto fenotípico de un knockout y en humanos puede ser un desafío. Los desafíos para caracterizar e interpretar clínicamente los knockouts incluyen la dificultad para llamar variantes de ADN, determinar la interrupción de la función de la proteína (anotación) y considerar la cantidad de influencia que tiene el mosaicismo en el fenotipo. [104]
Un estudio importante que investigó los nocauts humanos es el estudio Pakistan Risk of Myocardial Infarction. Se descubrió que los individuos que poseían un gen de pérdida de función heterocigoto knockout para el gen APOC3 tenían triglicéridos más bajos en la sangre después de consumir una comida rica en grasas en comparación con los individuos sin la mutación. Sin embargo, los individuos que poseen knockouts de genes homocigotos de pérdida de función del gen APOC3 mostraron el nivel más bajo de triglicéridos en la sangre después de la prueba de carga de grasa, ya que no producen proteína APOC3 funcional. [105]
Trastornos genéticos humanos
La mayoría de los aspectos de la biología humana involucran factores genéticos (heredados) y no genéticos (ambientales). Algunas variaciones heredadas influyen en aspectos de nuestra biología que no son de naturaleza médica (altura, color de ojos, capacidad para saborear u oler ciertos compuestos, etc.). Además, algunos trastornos genéticos solo causan enfermedades en combinación con los factores ambientales apropiados (como la dieta). Con estas advertencias, los trastornos genéticos pueden describirse como enfermedades clínicamente definidas causadas por la variación de la secuencia del ADN genómico. En los casos más sencillos, el trastorno puede asociarse con la variación en un solo gen. Por ejemplo, la fibrosis quística es causada por mutaciones en el gen CFTR y es el trastorno recesivo más común en poblaciones caucásicas con más de 1300 mutaciones diferentes conocidas. [106]
Las mutaciones que causan enfermedades en genes específicos suelen ser graves en términos de función genética y, afortunadamente, son raras, por lo que los trastornos genéticos son igualmente raros individualmente. Sin embargo, dado que hay muchos genes que pueden variar para causar trastornos genéticos, en conjunto constituyen un componente importante de las afecciones médicas conocidas, especialmente en la medicina pediátrica. Los trastornos genéticos caracterizados molecularmente son aquellos para los que se ha identificado el gen causal subyacente. Actualmente hay aproximadamente 2.200 de estos trastornos anotados en la base de datos OMIM . [106]
Los estudios de trastornos genéticos a menudo se realizan mediante estudios basados en la familia. En algunos casos, se emplean enfoques basados en la población, particularmente en el caso de las denominadas poblaciones fundadoras, como las de Finlandia, Canadá-Francia, Utah, Cerdeña, etc. El diagnóstico y el tratamiento de los trastornos genéticos suelen ser realizados por un médico- genetista . entrenado en genética clínica / médica. Es probable que los resultados del Proyecto Genoma Humano proporcionen una mayor disponibilidad de pruebas genéticas para los trastornos relacionados con los genes y, finalmente, un tratamiento mejorado. Los padres pueden ser evaluados para detectar condiciones hereditarias y asesorarles sobre las consecuencias, la probabilidad de herencia y cómo evitarlas o mejorarlas en su descendencia.
Hay muchos tipos diferentes de variación de la secuencia de ADN, que van desde cromosomas completos extra o faltantes hasta cambios de un solo nucleótido. Generalmente se presume que gran parte de la variación genética que ocurre naturalmente en las poblaciones humanas es fenotípicamente neutra, es decir, tiene poco o ningún efecto detectable en la fisiología del individuo (aunque puede haber diferencias fraccionarias en la aptitud definidas durante períodos de tiempo evolutivos). Los trastornos genéticos pueden ser causados por cualquiera o todos los tipos conocidos de variación de secuencia. Para caracterizar molecularmente un nuevo trastorno genético, es necesario establecer un vínculo causal entre una variante de secuencia genómica particular y la enfermedad clínica bajo investigación. Estos estudios constituyen el ámbito de la genética molecular humana.
Con la llegada del Proyecto Genoma Humano e Internacional HapMap , se ha vuelto factible explorar influencias genéticas sutiles en muchas enfermedades comunes como diabetes, asma, migraña, esquizofrenia, etc. Aunque se han establecido algunos vínculos causales entre variantes de secuencia genómica en genes particulares y algunas de estas enfermedades, a menudo con mucha publicidad en los medios de comunicación generales, generalmente no se consideran trastornos genéticos per se, ya que sus causas son complejas e involucran muchos factores genéticos y ambientales diferentes. Por lo tanto, puede haber desacuerdo en casos particulares sobre si una afección médica específica debe denominarse trastorno genético.
Otros trastornos genéticos a mencionar son el síndrome de Kallman y el síndrome de Pfeiffer (gen FGFR1), la distrofia corneal de Fuchs (gen TCF4), la enfermedad de Hirschsprung (genes RET y FECH), el síndrome de Bardet-Biedl 1 (genes CCDC28B y BBS1), el síndrome de Bardet-Biedl 10 (gen BBS10) y distrofia muscular facioescapulohumeral tipo 2 (genes D4Z4 y SMCHD1). [107]
La secuenciación del genoma ahora puede reducir el genoma a ubicaciones específicas para encontrar con mayor precisión mutaciones que resultarán en un trastorno genético. Las variantes de número de copias (CNV) y las variantes de un solo nucleótido (SNV) también se pueden detectar al mismo tiempo que la secuenciación del genoma con procedimientos de secuenciación más nuevos disponibles, denominados Secuenciación de próxima generación (NGS). Esto solo analiza una pequeña porción del genoma, alrededor del 1-2%. Los resultados de esta secuenciación se pueden utilizar para el diagnóstico clínico de una afección genética, incluido el síndrome de Usher , enfermedad de la retina, problemas de audición, diabetes, epilepsia, enfermedad de Leigh , cánceres hereditarios, enfermedades neuromusculares, inmunodeficiencias primarias, inmunodeficiencia combinada grave (SCID) y enfermedades de las mitocondrias. [108] NGS también se puede utilizar para identificar a los portadores de enfermedades antes de la concepción. Las enfermedades que se pueden detectar en este secuenciación incluyen la enfermedad de Tay-Sachs , síndrome de Bloom , la enfermedad de Gaucher , enfermedad de Canavan , disautonomía familiar , fibrosis quística, la atrofia muscular espinal , y el síndrome del cromosoma X frágil . La secuenciación del próximo genoma se puede reducir para buscar específicamente enfermedades más prevalentes en determinadas poblaciones étnicas. [109]
Trastorno | Predominio | Cromosoma o gen involucrado |
---|---|---|
Condiciones cromosómicas | ||
Síndrome de Down | 1: 600 | Cromosoma 21 |
síndrome de Klinefelter | 1: 500–1000 hombres | Cromosoma X adicional |
Síndrome de Turner | 1: 2000 hembras | Pérdida del cromosoma X |
Anemia falciforme | 1 de cada 50 nacimientos en partes de África; más raro en otros lugares | β-globina (en el cromosoma 11) |
Síndrome de Bloom | 1: 48000 judíos asquenazíes | BLM |
Cánceres | ||
Cáncer de mama / ovario (susceptibilidad) | ~ 5% de los casos de estos tipos de cáncer | BRCA1, BRCA2 |
FAP (coli hereditaria sin poliposis) | 1: 3500 | APC |
Síndrome de Lynch | 5 a 10% de todos los casos de cáncer de intestino | MLH1, MSH2, MSH6, PMS2 |
Anemia de Fanconi | 1: 130000 nacimientos | FANCC |
Condiciones neurologicas | ||
enfermedad de Huntington | 1: 20000 | Huntingtin |
Enfermedad de Alzheimer : inicio temprano | 1: 2500 | PS1, PS2, APLICACIÓN |
Tay-Sachs | 1: 3600 nacimientos de judíos asquenazíes | Gen HEXA (en el cromosoma 15) |
Enfermedad de Canavan | 2.5% ascendencia judía de Europa del Este | Gen ASPA (en el cromosoma 17) |
Disautonomía familiar | 600 casos conocidos en todo el mundo desde su descubrimiento | Gen IKBKAP (en el cromosoma 9) |
Síndrome X frágil | 1,4: 10000 en machos, 0,9: 10000 en hembras | Gen FMR1 (en el cromosoma X) |
Mucolipidosis tipo IV | 1:90 a 1: 100 en judíos asquenazíes | MCOLN1 |
Otras condiciones | ||
Fibrosis quística | 1: 2500 | CFTR |
Distrofia muscular de Duchenne | 1: 3500 niños | Distrofina |
Distrofia muscular de Becker | 1,5-6: 100000 machos | DMD |
Beta talasemia | 1: 100000 | HBB |
Hiperplasia suprarrenal congénita | 1: 280 en nativos americanos y esquimales yupik 1: 15000 en caucásicos estadounidenses | CYP21A2 |
Enfermedad por almacenamiento de glucógeno tipo I | 1: 100000 nacimientos en América | G6PC |
Enfermedad de la orina con jarabe de arce | 1: 180000 en los EE. UU. 1: 176 en comunidades menonitas / amish 1: 250000 en Austria | BCKDHA, BCKDHB, DBT, DLD |
Enfermedad de Niemann-Pick, asociada a SMPD1 | 1200 casos en todo el mundo | SMPD1 |
Síndrome de Usher | 1: 23000 en EE. UU. 1: 28000 en Noruega 1: 12500 en Alemania | CDH23, CLRN1, DFNB31, GPR98, MYO7A, PCDH15, USH1C, USH1G, USH2A |
Evolución
Cronología de los homínidos | ||||||||||||||||||||||
−10 - - −9 - - −8 - - −7 - - −6 - - −5 - - −4 - - −3 - - −2 - - −1 - - 0 - | Hominini Nakalipithecus Ouranopithecus Oreopithecus Sahelanthropus Orrorin Ardipithecus Australopithecus Homo habilis Homo erectus H. heidelbergensis Homo sapiens Neandertales |
| ||||||||||||||||||||
(hace millones de años ) |
Los estudios de genómica comparativa de genomas de mamíferos sugieren que aproximadamente el 5% del genoma humano se ha conservado por evolución desde la divergencia de linajes existentes hace aproximadamente 200 millones de años, que contienen la gran mayoría de genes. [110] [111] El genoma publicado del chimpancé difiere del genoma humano en un 1,23% en las comparaciones de secuencias directas. [112] Alrededor del 20% de esta cifra se explica por la variación dentro de cada especie, dejando solo ~ 1,06% de divergencia de secuencia constante entre humanos y chimpancés en genes compartidos. [113] Sin embargo, esta diferencia de nucleótido a nucleótido se ve eclipsada por la porción de cada genoma que no se comparte, incluido alrededor del 6% de los genes funcionales que son exclusivos de los humanos o los chimpancés. [114]
En otras palabras, las considerables diferencias observables entre humanos y chimpancés pueden deberse tanto o más a la variación a nivel del genoma en el número, función y expresión de los genes, más que a cambios en la secuencia del ADN en genes compartidos. De hecho, incluso dentro de los seres humanos, se ha descubierto que existe una cantidad de variación en el número de copias (CNV) que antes no se apreciaba y que puede constituir hasta un 5 - 15% del genoma humano. En otras palabras, entre humanos, podría haber +/- 500,000,000 pares de bases de ADN, algunos son genes activos, otros inactivados o activos a diferentes niveles. Queda por ver el significado completo de este hallazgo. En promedio, un gen codificador de proteínas humano típico se diferencia de su ortólogo de chimpancé en sólo dos sustituciones de aminoácidos ; casi un tercio de los genes humanos tienen exactamente la misma traducción de proteínas que sus ortólogos de chimpancés. Una diferencia importante entre los dos genomas es el cromosoma 2 humano , que es equivalente a un producto de fusión de los cromosomas 12 y 13 de los chimpancés [115] (posteriormente renombrados como cromosomas 2A y 2B, respectivamente).
Los seres humanos han sufrido una pérdida extraordinaria de genes receptores olfativos durante nuestra evolución reciente, lo que explica nuestro sentido del olfato relativamente crudo en comparación con la mayoría de los otros mamíferos. La evidencia evolutiva sugiere que el surgimiento de la visión del color en humanos y varias otras especies de primates ha disminuido la necesidad del sentido del olfato. [116]
En septiembre de 2016, los científicos informaron que, basándose en estudios genéticos de ADN humano, todos los no africanos en el mundo de hoy se pueden rastrear hasta una sola población que salió de África hace entre 50.000 y 80.000 años. [117]
ADN mitocondrial
El ADN mitocondrial humano es de gran interés para los genetistas, ya que indudablemente juega un papel en la enfermedad mitocondrial . También arroja luz sobre la evolución humana; por ejemplo, el análisis de la variación en el genoma mitocondrial humano ha llevado a la postulación de un ancestro común reciente para todos los humanos en la línea de descendencia materna (ver Eva mitocondrial ).
Debido a la falta de un sistema para verificar errores de copia, [118] el ADN mitocondrial (ADNmt) tiene una tasa de variación más rápida que el ADN nuclear. Esta tasa de mutación 20 veces mayor permite que el ADNmt se utilice para un rastreo más preciso de la ascendencia materna. [ cita requerida ] Los estudios de ADNmt en poblaciones han permitido rastrear antiguas rutas de migración, como la migración de nativos americanos de Siberia [119] o polinesios del sureste de Asia . [ cita requerida ] También se ha utilizado para mostrar que no hay rastros de ADN neandertal en la mezcla de genes europeos heredados a través de un linaje puramente materno. [120] Debido a la restricción total o nula de la herencia del mtDNA, este resultado (sin rastro de mtDNA de Neandertal) sería probable a menos que hubiera un gran porcentaje de ascendencia neandertal, o hubiera una fuerte selección positiva para ese mtDNA. Por ejemplo, retrocediendo 5 generaciones, solo 1 de los 32 antepasados de una persona contribuyó al ADNmt de esa persona, por lo que si uno de estos 32 fuera neandertal puro, se espera que ~ 3% del ADN autosómico de esa persona sea de origen neandertal, sin embargo, habrían una probabilidad de ~ 97% de no tener rastros de ADNmt de Neandertal. [ cita requerida ]
Epigenoma
La epigenética describe una variedad de características del genoma humano que trascienden su secuencia de ADN primaria, como el empaquetamiento de la cromatina , las modificaciones de histonas y la metilación del ADN , y que son importantes en la regulación de la expresión génica, la replicación del genoma y otros procesos celulares. Los marcadores epigenéticos fortalecen y debilitan la transcripción de ciertos genes, pero no afectan la secuencia real de los nucleótidos del ADN. La metilación del ADN es una forma importante de control epigenético sobre la expresión génica y uno de los temas más estudiados en epigenética. Durante el desarrollo, el perfil de metilación del ADN humano experimenta cambios dramáticos. En las células de la línea germinal temprana, el genoma tiene niveles de metilación muy bajos. Estos niveles bajos generalmente describen genes activos. A medida que avanza el desarrollo, las etiquetas de impronta parental conducen a una mayor actividad de metilación. [121] [122]
Los patrones epigenéticos pueden identificarse entre tejidos dentro de un individuo, así como entre los propios individuos. Los genes idénticos que tienen diferencias solo en su estado epigenético se denominan epialélicos . Los epialleles se pueden clasificar en tres categorías: los que están directamente determinados por el genotipo de un individuo, los que están influenciados por el genotipo y los que son completamente independientes del genotipo. El epigenoma también está influenciado significativamente por factores ambientales. La dieta, las toxinas y las hormonas afectan el estado epigenético. Los estudios sobre manipulación dietética han demostrado que las dietas deficientes en metilo están asociadas con la hipometilación del epigenoma. Dichos estudios establecen a la epigenética como una interfaz importante entre el medio ambiente y el genoma. [123]
Ver también
- Genética
- Genómica
- Proyecto Genográfico
- Organización genómica
- Repeticiones de copia bajas
- ADN no codificante
- Secuenciación del genoma completo
- Declaración Universal sobre el Genoma Humano y los Derechos Humanos
Referencias
- ^ "GRCh38.p13" . ncbi . Consorcio de referencia del genoma . Consultado el 8 de junio de 2020 .
- ^ Brown TA (2002). El genoma humano (2ª ed.). Oxford: Wiley-Liss.
- ^ a b Abecasis GR, Auton A, Brooks LD, DePristo MA, Durbin RM, Handsaker RE, Kang HM, Marth GT, McVean GA (noviembre de 2012). "Un mapa integrado de variación genética de 1.092 genomas humanos" . Naturaleza . 491 (7422): 56–65. Código Bibcode : 2012Natur.491 ... 56T . doi : 10.1038 / nature11632 . PMC 3498066 . PMID 23128226 .
- ^ Auton A, Brooks LD, Durbin RM, Garrison EP, Kang HM, Korbel JO, et al. (Octubre de 2015). "Una referencia mundial para la variación genética humana" . Naturaleza . 526 (7571): 68–74. Bibcode : 2015Natur.526 ... 68T . doi : 10.1038 / nature15393 . PMC 4750478 . PMID 26432245 .
- ^ Secuenciación de chimpancés; Consorcio de análisis (2005). "Secuencia inicial del genoma del chimpancé y comparación con el genoma humano" (PDF) . Naturaleza . 437 (7055): 69–87. Código Bibliográfico : 2005Natur.437 ... 69. . doi : 10.1038 / nature04072 . PMID 16136131 . S2CID 2638825 .
- ^ Varki A, Altheide TK (diciembre de 2005). "Comparando los genomas humanos y de chimpancé: buscando agujas en un pajar" . Investigación del genoma . 15 (12): 1746–58. doi : 10.1101 / gr.3737405 . PMID 16339373 .
- ^ Wade N (23 de septiembre de 1999). "Número de genes humanos se pone en 140.000, una ganancia significativa" . The New York Times .
- ^ a b Consorcio Internacional de Secuenciación del Genoma Humano (octubre de 2004). "Finalización de la secuencia eucromática del genoma humano" . Naturaleza . 431 (7011): 931–45. Código Bibliográfico : 2004Natur.431..931H . doi : 10.1038 / nature03001 . PMID 15496913 .
- ^ Ezkurdia I, Juan D, Rodriguez JM, Frankish A, Diekhans M, Harrow J, Vazquez J, Valencia A, Tress ML (noviembre de 2014). "Varias hebras de evidencia sugieren que puede haber tan solo 19.000 genes codificadores de proteínas humanas" . Genética molecular humana . 23 (22): 5866–78. doi : 10.1093 / hmg / ddu309 . PMC 4204768 . PMID 24939910 .
- ^ Saey TH (17 de septiembre de 2018). "Un recuento de genes humanos eleva el número a al menos 46.831" . Noticias de ciencia .
- ^ Alles J, Fehlmann T, Fischer U, Backes C, Galata V, Minet M, et al. (Abril de 2019). "Una estimación del número total de verdaderos miARN humanos" . Investigación de ácidos nucleicos . 47 (7): 3353–3364. doi : 10.1093 / nar / gkz097 . PMC 6468295 . PMID 30820533 .
- ^ a b c Pennisi E (septiembre de 2012). "Genómica. Proyecto ENCODE escribe elogio para el ADN basura". Ciencia . 337 (6099): 1159-1161. doi : 10.1126 / science.337.6099.1159 . PMID 22955811 .
- ^ Zhang S (28 de noviembre de 2018). "Faltan 300 millones de letras de ADN en el genoma humano". El Atlántico .
- ^ a b c Consorcio Internacional de Secuenciación del Genoma Humano (febrero de 2001). "Secuenciación inicial y análisis del genoma humano" . Naturaleza . 409 (6822): 860–921. Código Bib : 2001Natur.409..860L . doi : 10.1038 / 35057062 . PMID 11237011 .Mantenimiento de CS1: utiliza el parámetro de autores ( enlace )
- ^ El consorcio internacional de secuenciación del genoma humano publica la secuencia y el análisis del genoma humano
- ^ Pennisi E (febrero de 2001). "El genoma humano". Ciencia . 291 (5507): 1177–80. doi : 10.1126 / science.291.5507.1177 . PMID 11233420 . S2CID 38355565 .
- ^ Molteni M (19 de noviembre de 2018). "Ahora puede secuenciar todo su genoma por sólo $ 200" . Cableado .
- ^ Wrighton, Katharine (febrero de 2021). "Llenar los huecos de telómero a telómero" . Hitos de la naturaleza: Secuenciación genómica : S21.
- ^ Pollack A (2 de junio de 2016). "Los científicos anuncian HGP-Write, proyecto para sintetizar el genoma humano" . New York Times . Consultado el 2 de junio de 2016 .
- ^ Boeke JD, Church G, Hessel A, Kelley NJ, Arkin A, Cai Y, et al. (Julio de 2016). "El Proyecto Genoma-Escritura". Ciencia . 353 (6295): 126–7. Código bibliográfico : 2016Sci ... 353..126B . doi : 10.1126 / science.aaf6850 . PMID 27256881 . S2CID 206649424 .
- ^ Zhang S (28 de noviembre de 2018). "Faltan 300 millones de letras de ADN en el genoma humano" . El Atlántico . Consultado el 16 de agosto de 2019 .
- ^ Chaisson MJ, Huddleston J, Dennis MY, Sudmant PH, Malig M, Hormozdiari F, et al. (Enero de 2015). "Resolver la complejidad del genoma humano mediante secuenciación de una sola molécula" . Naturaleza . 517 (7536): 608-11. Código Bibliográfico : 2015Natur.517..608C . doi : 10.1038 / nature13907 . PMC 4317254 . PMID 25383537 .
- ^ Miga KH , Koren S, Rhie A, Vollger MR, Gershman A, Bzikadze A y col. (Septiembre de 2020). "Ensamblaje de telómero a telómero de un cromosoma X humano completo" . Naturaleza . 585 (7823): 79–84. Código Bib : 2020Natur.585 ... 79M . doi : 10.1038 / s41586-020-2547-7 . PMC 7484160 . PMID 32663838 .
- ^ Versión 87 del navegador del genoma Ensembl [ enlace muerto permanente ] (diciembre de 2016) para la mayoría de los valores; Lanzamiento 68 del navegador del genoma Ensembl (julio de 2012) para miRNA, rRNA, snRNA, snoRNA.
- ^ Piovesan A, Pelleri MC, Antonaros F, Strippoli P, Caracausi M, Vitale L (febrero de 2019). "Sobre la longitud, el peso y el contenido de GC del genoma humano" . Notas de investigación de BMC . 12 (1): 106. doi : 10.1186 / s13104-019-4137-z . PMC 6391780 . PMID 30813969 .
- ^ Salzberg SL (agosto de 2018). "Preguntas abiertas: ¿Cuántos genes tenemos?" . Biología BMC . 16 (1): 94. doi : 10.1186 / s12915-018-0564-x . PMC 6100717 . PMID 30124169 .
- ^ "Estadísticas de Gencode, versión 28" . Archivado desde el original el 2 de marzo de 2018 . Consultado el 12 de julio de 2018 .
- ^ "Estadísticas de Ensembl para la versión 92.38, correspondiente a Gencode v28" . Consultado el 12 de julio de 2018 .
- ^ "NCBI Homo sapiens Annotation Release 108" . NIH. 2016.
- ^ "Estadísticas de AJEDREZ, versión 2.0" . Centro de Biología Computacional . Universidad Johns Hopkins.
- ^ "Finalización del proyecto del genoma humano: preguntas más frecuentes" . Instituto Nacional de Investigación del Genoma Humano (NHGRI) . Consultado el 2 de febrero de 2019 .
- ^ Christley S, Lu Y, Li C, Xie X (enero de 2009). "Genomas humanos como archivos adjuntos de correo electrónico" . Bioinformática . 25 (2): 274–5. doi : 10.1093 / bioinformatics / btn582 . PMID 18996942 .
- ^ Liu Z, Venkatesh SS, Maley CC (octubre de 2008). "Cobertura del espacio de secuencia, entropía de genomas y potencial para detectar ADN no humano en muestras humanas" . BMC Genomics . 9 : 509. doi : 10.1186 / 1471-2164-9-509 . PMC 2628393 . PMID 18973670 ., higo. 6, utilizando los estimadores de tasa de entropía de Lempel-Ziv .
- ^ Waters K (7 de marzo de 2007). "Genética molecular" . Enciclopedia de Filosofía de Stanford . Consultado el 18 de julio de 2013 .
- ^ Gannett L (26 de octubre de 2008). "El Proyecto del Genoma Humano" . Enciclopedia de Filosofía de Stanford . Consultado el 18 de julio de 2013 .
- ^ Gráfico circular PANTHER en la página de inicio del Sistema de clasificación PANTHER. Consultado el 25 de mayo de 2011
- ^ Lista de proteínas humanas en el proteoma de referencia humano Uniprot ; Consultado el 28 de enero de 2015.
- ^ Kauffman SA (marzo de 1969). "Estabilidad metabólica y epigénesis en redes genéticas construidas aleatoriamente". Revista de Biología Teórica . 22 (3): 437–67. doi : 10.1016 / 0022-5193 (69) 90015-0 . PMID 5803332 .
- ^ Ohno S (1972). "Un argumento a favor de la simplicidad genética del hombre y otros mamíferos". Revista de evolución humana . 1 (6): 651–662. doi : 10.1016 / 0047-2484 (72) 90011-5 .
- ^ Sémon M, Mouchiroud D, Duret L (febrero de 2005). "Relación entre la expresión génica y el contenido de GC en mamíferos: significación estadística y relevancia biológica" . Genética molecular humana . 14 (3): 421–7. doi : 10.1093 / hmg / ddi038 . PMID 15590696 .
- ^ M. Huang, H. Zhu, B. Shen, G. Gao, "Una marcha no aleatoria a través del genoma humano" , Tercera Conferencia Internacional sobre Bioinformática e Ingeniería Biomédica (UCBBE, 2009), 1-3
- ^ a b Bang ML, Centner T, Fornoff F, Geach AJ, Gotthardt M, McNabb M, Witt CC, Labeit D, Gregorio CC, Granzier H, Labeit S (2001). "La secuencia completa del gen de la titina, la expresión de una isoforma de titina inusual de aproximadamente 700 kDa y su interacción con la obscurina identifican un nuevo sistema de unión de la línea Z a la banda I" . Investigación de circulación . 89 (11): 1065–72. doi : 10.1161 / hh2301.100981 . PMID 11717165 .
- ^ a b Piovesan A, Caracausi M, Antonaros F, Pelleri MC, Vitale L (2016). "GeneBase 1.1: una herramienta para resumir datos de conjuntos de datos de genes NCBI y su aplicación a una actualización de las estadísticas de genes humanos" . Base de datos: The Journal of Biological Databases and Curation . 2016 : baw153. doi : 10.1093 / database / baw153 . PMC 5199132 . PMID 28025344 .
- ^ Navegador del genoma Ensembl (julio de 2012)
- ^ Gregory TR (septiembre de 2005). "Sinergia entre secuencia y tamaño en genómica a gran escala". Nature Reviews Genética . 6 (9): 699–708. doi : 10.1038 / nrg1674 . PMID 16151375 . S2CID 24237594 .
- ^ a b Palazzo AF, Akef A (junio de 2012). "La exportación nuclear como árbitro clave de la" identidad del ARNm "en eucariotas". Biochimica et Biophysica Acta (BBA) - Mecanismos reguladores de genes . 1819 (6): 566–77. doi : 10.1016 / j.bbagrm.2011.12.012 . PMID 22248619 .
- ^ Ludwig MZ (diciembre de 2002). "Evolución funcional del ADN no codificante". Opinión Actual en Genética y Desarrollo . 12 (6): 634–9. doi : 10.1016 / S0959-437X (02) 00355-6 . PMID 12433575 .
- ^ Martens JA, Laprade L, Winston F (junio de 2004). "Se requiere transcripción intergénica para reprimir el gen SER3 de Saccharomyces cerevisiae". Naturaleza . 429 (6991): 571–4. Código Bibliográfico : 2004Natur.429..571M . doi : 10.1038 / nature02538 . PMID 15175754 . S2CID 809550 .
- ^ Tsai MC, Manor O, Wan Y, Mosammaparast N, Wang JK, Lan F, Shi Y, Segal E, Chang HY (agosto de 2010). "ARN no codificante largo como andamio modular de complejos de modificación de histonas" . Ciencia . 329 (5992): 689–93. Código Bibliográfico : 2010Sci ... 329..689T . doi : 10.1126 / science.1192002 . PMC 2967777 . PMID 20616235 .
- ^ Bartolomei MS, Zemel S, Tilghman SM (mayo de 1991). "Impresión parental del gen H19 del ratón". Naturaleza . 351 (6322): 153–5. Código Bibliográfico : 1991Natur.351..153B . doi : 10.1038 / 351153a0 . PMID 1709450 . S2CID 4364975 .
- ^ Kobayashi T, Ganley AR (septiembre de 2005). "Regulación de recombinación por disociación de cohesina inducida por transcripción en repeticiones de ADNr". Ciencia . 309 (5740): 1581–4. Código Bibliográfico : 2005Sci ... 309.1581K . doi : 10.1126 / science.1116102 . PMID 16141077 . S2CID 21547462 .
- ^ Salmena L, Poliseno L, Tay Y, Kats L, Pandolfi PP (agosto de 2011). "Una hipótesis de ceRNA: ¿la piedra de Rosetta de un lenguaje de ARN oculto?" . Celular . 146 (3): 353–8. doi : 10.1016 / j.cell.2011.07.014 . PMC 3235919 . PMID 21802130 .
- ^ Pei B, Sisu C, Frankish A, Howald C, Habegger L, Mu XJ, Harte R, Balasubramanian S, Tanzer A, Diekhans M, Reymond A, Hubbard TJ, Harrow J, Gerstein MB (2012). "El recurso pseudogen GENCODE" . Biología del genoma . 13 (9): R51. doi : 10.1186 / gb-2012-13-9-r51 . PMC 3491395 . PMID 22951037 .
- ^ Gilad Y, Man O, Pääbo S, Lancet D (marzo de 2003). "Pérdida humana específica de genes receptores olfativos" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 100 (6): 3324–7. Código Bibliográfico : 2003PNAS..100.3324G . doi : 10.1073 / pnas.0535697100 . PMC 152291 . PMID 12612342 .
- ^ Iyer MK, Niknafs YS, Malik R, Singhal U, Sahu A, Hosono Y, Barrette TR, Prensner JR, Evans JR, Zhao S, Poliakov A, Cao X, Dhanasekaran SM, Wu YM, Robinson DR, Beer DG, Feng FY , Iyer HK, Chinnaiyan AM (marzo de 2015). "El panorama de los ARN largos no codificantes en el transcriptoma humano" . Genética de la naturaleza . 47 (3): 199-208. doi : 10.1038 / ng.3192 . PMC 4417758 . PMID 25599403 .
- ^ Eddy SR (diciembre de 2001). "Genes de ARN no codificantes y el mundo moderno del ARN". Nature Reviews Genética . 2 (12): 919–29. doi : 10.1038 / 35103511 . PMID 11733745 . S2CID 18347629 .
- ^ Managadze D, Lobkovsky AE, Wolf YI, Shabalina SA, Rogozin IB, Koonin EV (2013). "El vasto y conservado lincRNome de mamíferos" . PLOS Biología Computacional . 9 (2): e1002917. Código bibliográfico : 2013PLSCB ... 9E2917M . doi : 10.1371 / journal.pcbi.1002917 . PMC 3585383 . PMID 23468607 .
- ^ Palazzo AF, Lee ES (2015). "ARN no codificante: ¿qué es funcional y qué es basura?" . Fronteras en genética . 6 : 2. doi : 10.3389 / fgene.2015.00002 . PMC 4306305 . PMID 25674102 .
- ^ Mattick JS, Makunin IV (abril de 2006). "ARN no codificante" . Genética molecular humana . 15 Especificación nº 1: R17–29. doi : 10.1093 / hmg / ddl046 . PMID 16651366 .
- ^ a b Bernstein BE, Birney E, Dunham I, Green ED, Gunter C, Snyder M (septiembre de 2012). "Una enciclopedia integrada de elementos del ADN en el genoma humano" . Naturaleza . 489 (7414): 57–74. Código Bibliográfico : 2012Natur.489 ... 57T . doi : 10.1038 / nature11247 . PMC 3439153 . PMID 22955616 .
- ^ Birney E (5 de septiembre de 2012). "CODIFICAR: Mis propios pensamientos" . Blog de Ewan: Bioinformático en general .
- ^ Stamatoyannopoulos JA (septiembre de 2012). "¿Qué codifica nuestro genoma?" . Investigación del genoma . 22 (9): 1602-11. doi : 10.1101 / gr.146506.112 . PMC 3431477 . PMID 22955972 .
- ^ Carroll SB, Gompel N, Prudhomme B (mayo de 2008). "Regulación de la evolución". Scientific American . 298 (5): 60–67. Código bibliográfico : 2008SciAm.298e..60C . doi : 10.1038 / scientificamerican0508-60 . PMID 18444326 .
- ^ Miller JH, Ippen K, Scaife JG, Beckwith JR (1968). "La región promotor-operador del operón lac de Escherichia coli". J. Mol. Biol . 38 (3): 413-20. doi : 10.1016 / 0022-2836 (68) 90395-1 . PMID 4887877 .
- ^ Wright S, Rosenthal A, Flavell R, Grosveld F (1984). "Secuencias de ADN necesarias para la expresión regulada de genes de beta-globina en células de eritroleucemia murina". Celular . 38 (1): 265–73. doi : 10.1016 / 0092-8674 (84) 90548-8 . PMID 6088069 . S2CID 34587386 .
- ^ Nei M, Xu P, Glazko G (febrero de 2001). "Estimación de los tiempos de divergencia de secuencias multiproteínas para algunas especies de mamíferos y varios organismos relacionados lejanamente" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 98 (5): 2497–502. Código Bibliográfico : 2001PNAS ... 98.2497N . doi : 10.1073 / pnas.051611498 . PMC 30166 . PMID 11226267 .
- ^ Loots GG, Locksley RM, Blankespoor CM, Wang ZE, Miller W, Rubin EM, Frazer KA (abril de 2000). "Identificación de un regulador coordinado de las interleucinas 4, 13 y 5 mediante comparaciones de secuencia entre especies". Ciencia . 288 (5463): 136–40. Código Bibliográfico : 2000Sci ... 288..136L . doi : 10.1126 / science.288.5463.136 . PMID 10753117 . Resumen
- ^ Meunier M. "Genoscope y Whitehead anuncian una cobertura de secuencia alta del genoma de Tetraodon nigroviridis" . Genoscopio. Archivado desde el original el 16 de octubre de 2006 . Consultado el 12 de septiembre de 2006 .
- ^ Romero IG, Ruvinsky I, Gilad Y (julio de 2012). "Estudios comparativos de expresión génica y evolución de la regulación génica" . Nature Reviews Genética . 13 (7): 505–16. doi : 10.1038 / nrg3229 . PMC 4034676 . PMID 22705669 .
- ^ Schmidt D, Wilson MD, Ballester B, Schwalie PC, Brown GD, Marshall A, Kutter C, Watt S, Martinez-Jimenez CP, Mackay S, Talianidis I, Flicek P, Odom DT (mayo de 2010). "ChIP-seq de cinco vertebrados revela la dinámica evolutiva de la unión del factor de transcripción" . Ciencia . 328 (5981): 1036–40. Código Bibliográfico : 2010Sci ... 328.1036S . doi : 10.1126 / science.1186176 . PMC 3008766 . PMID 20378774 .
- ^ Wilson MD, Barbosa-Morais NL, Schmidt D, Conboy CM, Vanes L, Tybulewicz VL, Fisher EM, Tavaré S, Odom DT (octubre de 2008). "Transcripción específica de especies en ratones portadores del cromosoma 21 humano" . Ciencia . 322 (5900): 434–8. Código bibliográfico : 2008Sci ... 322..434W . doi : 10.1126 / science.1160930 . PMC 3717767 . PMID 18787134 .
- ^ Treangen TJ, Salzberg SL (enero de 2012). "ADN repetitivo y secuenciación de próxima generación: desafíos y soluciones computacionales" . Nature Reviews Genética . 13 (1): 36–46. doi : 10.1038 / nrg3117 . PMC 3324860 . PMID 22124482 .
- ^ Duitama J, Zablotskaya A, Gemayel R, Jansen A, Belet S, Vermeesch JR, Verstrepen KJ, Froyen G (mayo de 2014). "Análisis a gran escala de la variabilidad de repetición en tándem en el genoma humano" . Investigación de ácidos nucleicos . 42 (9): 5728–41. doi : 10.1093 / nar / gku212 . PMC 4027155 . PMID 24682812 .
- ^ Pierce BA (2012). Genética: un enfoque conceptual (4ª ed.). Nueva York: WH Freeman. págs. 538–540. ISBN 978-1-4292-3250-0.
- ^ Bennett EA, Keller H, Mills RE, Schmidt S, Moran JV, Weichenrieder O, Devine SE (diciembre de 2008). "Retrotransposones activos de Alu en el genoma humano" . Investigación del genoma . 18 (12): 1875–83. doi : 10.1101 / gr.081737.108 . PMC 2593586 . PMID 18836035 .
- ^ Liang KH, Yeh CT (2013). "Una red de restricción de expresión génica mediada por secuencias de Alu sentido y antisentido ubicadas en ARN mensajeros que codifican proteínas" . BMC Genomics . 14 : 325. doi : 10.1186 / 1471-2164-14-325 . PMC 3655826 . PMID 23663499 .
- ^ Brouha B, Schustak J, Badge RM, Lutz-Prigge S, Farley AH, Moran JV, Kazazian HH (abril de 2003). "Hot L1s representan la mayor parte de la retrotransposición en la población humana" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 100 (9): 5280–5. Código Bibliográfico : 2003PNAS..100.5280B . doi : 10.1073 / pnas.0831042100 . PMC 154336 . PMID 12682288 .
- ^ Barton NH, Briggs DE, Eisen JA, Goldstein DB, Patel NH (2007). Evolución . Cold Spring Harbor, Nueva York: Cold Spring Harbor Laboratory Press. ISBN 978-0-87969-684-9.
- ^ NCBI . "GRCh38 - hg38 - Genoma - Ensamblaje - NCBI" . ncbi.nlm.nih.gov . Consultado el 15 de marzo de 2019 .
- ^ "del discurso sobre el estado de la Unión de 2000 de Bill Clinton" . Archivado desde el original el 21 de febrero de 2017 . Consultado el 14 de junio de 2007 .
- ^ Redon R, Ishikawa S, Fitch KR, Feuk L, Perry GH, Andrews TD y col. (Noviembre de 2006). "Variación global en el número de copias en el genoma humano" . Naturaleza . 444 (7118): 444–54. Código Bibliográfico : 2006Natur.444..444R . doi : 10.1038 / nature05329 . PMC 2669898 . PMID 17122850 .
- ^ "¿Qué es un genoma?" . Genomenewsnetwork.org. 15 de enero de 2003 . Consultado el 31 de mayo de 2009 .
- ^ NCBI_user_services (29 de marzo de 2004). "Hoja de datos de mapeo" . Ncbi.nlm.nih.gov. Archivado desde el original el 19 de julio de 2010 . Consultado el 31 de mayo de 2009 .
- ^ "Sobre el proyecto" . HapMap . Consultado el 31 de mayo de 2009 .
- ^ "Versión de 2008: los investigadores producen el primer mapa de secuencia de variación estructural a gran escala en el genoma humano" . genome.gov . Consultado el 31 de mayo de 2009 .
- ^ Kidd JM, Cooper GM, Donahue WF, Hayden HS, Sampas N, Graves T, et al. (Mayo de 2008). "Mapeo y secuenciación de la variación estructural de ocho genomas humanos" . Naturaleza . 453 (7191): 56–64. Código Bibliográfico : 2008Natur.453 ... 56K . doi : 10.1038 / nature06862 . PMC 2424287 . PMID 18451855 .
- ^ Gray IC, Campbell DA, Spurr NK (2000). "Polimorfismos de un solo nucleótido como herramientas en genética humana" . Genética molecular humana . 9 (16): 2403–2408. doi : 10.1093 / hmg / 9.16.2403 . PMID 11005795 .
- ^ Lai E (junio de 2001). "Aplicación de tecnologías SNP en medicina: lecciones aprendidas y desafíos futuros" . Investigación del genoma . 11 (6): 927–9. doi : 10.1101 / gr.192301 . PMID 11381021 .
- ^ "Finalización del proyecto del genoma humano: preguntas más frecuentes" . genome.gov . Consultado el 31 de mayo de 2009 .
- ^ Singer E (4 de septiembre de 2007). "Genoma de Craig Venter" . Revisión de tecnología del MIT . Consultado el 25 de mayo de 2010 .
- ^ Pushkarev D, Neff NF, Quake SR (septiembre de 2009). "Secuenciación de una sola molécula de un genoma humano individual" . Biotecnología de la naturaleza . 27 (9): 847–50. doi : 10.1038 / nbt.1561 . PMC 4117198 . PMID 19668243 .
- ^ Ashley EA, Butte AJ, Wheeler MT, Chen R, Klein TE, Dewey FE, et al. (Mayo de 2010). "Evaluación clínica incorporando un genoma personal" . Lancet . 375 (9725): 1525–35. doi : 10.1016 / S0140-6736 (10) 60452-7 . PMC 2937184 . PMID 20435227 .
- ^ Dewey FE, Chen R, Cordero SP, Ormond KE, Caleshu C, Karczewski KJ, et al. (Septiembre de 2011). "Riesgo genético de genoma completo en fase en un cuarteto familiar utilizando una secuencia de referencia de alelos principales" . PLOS Genetics . 7 (9): e1002280. doi : 10.1371 / journal.pgen.1002280 . PMC 3174201 . PMID 21935354 .
- ^ "Complete Genomics agrega 29 conjuntos de datos completos de secuenciación del genoma humano de alta cobertura a su repositorio genómico público" .
- ^ Muestra I (17 de febrero de 2010). "El genoma de Desmond Tutu secuenciado como parte del estudio de diversidad genética" . The Guardian .
- ^ Schuster SC, Miller W, Ratan A, Tomsho LP, Giardine B, Kasson LR, et al. (Febrero de 2010). "Completar genomas khoisan y bantú del sur de África" . Naturaleza . 463 (7283): 943–7. Código Bibliográfico : 2010Natur.463..943S . doi : 10.1038 / nature08795 . PMC 3890430 . PMID 20164927 .
- ^ Rasmussen M, Li Y, Lindgreen S, Pedersen JS, Albrechtsen A, Moltke I y col. (Febrero de 2010). "Secuencia del genoma humano antiguo de un paleo-esquimal extinto" . Naturaleza . 463 (7282): 757–62. Código Bibliográfico : 2010Natur.463..757R . doi : 10.1038 / nature08835 . PMC 3951495 . PMID 20148029 .
- ^ Corpas M , Cariaso M, Coletta A, Weiss D, Harrison AP, Moran F, Yang H (12 de noviembre de 2013). "Un conjunto de datos completo de genómica familiar de dominio público". bioRxiv 10.1101 / 000216 .
- ^ Corpas M (junio de 2013). "Crowdsourcing del corpasome" . Código fuente para biología y medicina . 8 (1): 13. doi : 10.1186 / 1751-0473-8-13 . PMC 3706263 . PMID 23799911 .
- ^ Mao Q, Ciotlos S, Zhang RY, Ball MP, Chin R, Carnevali P, et al. (Octubre de 2016). "Las secuencias del genoma completo y los haplotipos en fase experimental de más de 100 genomas personales" . GigaScience . 5 (1): 42. doi : 10.1186 / s13742-016-0148-z . PMC 5057367 . PMID 27724973 .
- ^ Cai B, Li B, Kiga N, Thusberg J, Bergquist T, Chen YC, et al. (Septiembre de 2017). "Coincidencia de fenotipos con genomas completos: lecciones aprendidas de cuatro iteraciones de los desafíos de la comunidad del proyecto del genoma personal" . Mutación humana . 38 (9): 1266-1276. doi : 10.1002 / humu.23265 . PMC 5645203 . PMID 28544481 .
- ^ Gonzaga-Jauregui C, Lupski JR, Gibbs RA (2012). "Secuenciación del genoma humano en salud y enfermedad" . Revisión anual de medicina . 63 : 35–61. doi : 10.1146 / annurev-med-051010-162644 . PMC 3656720 . PMID 22248320 .
- ^ Choi M, Scholl UI, Ji W, Liu T, Tikhonova IR, Zumbo P, Nayir A, Bakkaloğlu A, Ozen S, Sanjad S, Nelson-Williams C, Farhi A, Mane S, Lifton RP (noviembre de 2009). "Diagnóstico genético por captura de todo el exoma y secuenciación masiva de ADN en paralelo" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 106 (45): 19096–101. Código bibliográfico : 2009PNAS..10619096C . doi : 10.1073 / pnas.0910672106 . PMC 2768590 . PMID 19861545 .
- ^ a b Narasimhan VM, Xue Y, Tyler-Smith C (abril de 2016). "Portadores de knockout humanos: ¿muertos, enfermos, sanos o mejorados?" . Tendencias en Medicina Molecular . 22 (4): 341–351. doi : 10.1016 / j.molmed.2016.02.006 . PMC 4826344 . PMID 26988438 .
- ^ Saleheen D, Natarajan P, Armean IM, Zhao W, Rasheed A, Khetarpal SA, et al. (Abril de 2017). "Knockouts humanos y análisis fenotípico en una cohorte con alta tasa de consanguinidad" . Naturaleza . 544 (7649): 235–239. Código Bib : 2017Natur.544..235S . doi : 10.1038 / nature22034 . PMC 5600291 . PMID 28406212 .
- ^ a b Hamosh A, Scott AF, Amberger J, Bocchini C, Valle D, McKusick VA (enero de 2002). "Herencia mendeliana en línea en el hombre (OMIM), una base de conocimientos de genes humanos y trastornos genéticos" . Investigación de ácidos nucleicos . 30 (1): 52–5. doi : 10.1093 / nar / 30.1.52 . PMC 99152 . PMID 11752252 .
- ^ Katsanis N (noviembre de 2016). "El continuo de la causalidad en los trastornos genéticos humanos" . Biología del genoma . 17 (1): 233. doi : 10.1186 / s13059-016-1107-9 . PMC 5114767 . PMID 27855690 .
- ^ Wong LC (2017). "Resumen de la utilidad clínica de la secuenciación de próxima generación en el diagnóstico molecular de los trastornos genéticos humanos". En Wong LC (ed.). Diagnóstico molecular clínico basado en secuenciación de próxima generación de trastornos genéticos humanos . Springer International Publishing. págs. 1-11. doi : 10.1007 / 978-3-319-56418-0_1 . ISBN 978-3-319-56418-0. Falta o vacío
|title=
( ayuda ) - ^ Fedick A, Zhang J (2017). "Próxima generación de detección de portadores". En Wong LC (ed.). Diagnóstico molecular clínico basado en secuenciación de próxima generación de trastornos genéticos humanos . Springer International Publishing. págs. 339–354. doi : 10.1007 / 978-3-319-56418-0_16 . ISBN 978-3-319-56418-0. Falta o vacío
|title=
( ayuda ) - ^ Waterston RH, Lindblad-Toh K, Birney E, Rogers J, Abril JF, Agarwal P, Agarwala R, Ainscough R, Alexandersson M, et al. (Diciembre de 2002). "Secuenciación inicial y análisis comparativo del genoma del ratón" . Naturaleza . 420 (6915): 520–62. Código Bibliográfico : 2002Natur.420..520W . doi : 10.1038 / nature01262 . PMID 12466850 .
la proporción de segmentos pequeños (50-100 pb) en el genoma de los mamíferos que están bajo selección (purificadora) se puede estimar en alrededor del 5%. Esta proporción es mucho más alta de lo que se puede explicar por secuencias codificantes de proteínas solas, lo que implica que el genoma contiene muchas características adicionales (como regiones no traducidas, elementos reguladores, genes no codificantes de proteínas y elementos estructurales cromosómicos) bajo selección para función biológica. .
- ^ Birney E, Stamatoyannopoulos JA, Dutta A, Guigó R, Gingeras TR, Margulies EH, et al. (Junio de 2007). "Identificación y análisis de elementos funcionales en el 1% del genoma humano por el proyecto piloto ENCODE" . Naturaleza . 447 (7146): 799–816. Código Bibliográfico : 2007Natur.447..799B . doi : 10.1038 / nature05874 . PMC 2212820 . PMID 17571346 .
- ^ La secuenciación del chimpancé; Consorcio de análisis (septiembre de 2005). "Secuencia inicial del genoma del chimpancé y comparación con el genoma humano" . Naturaleza . 437 (7055): 69–87. Código Bibliográfico : 2005Natur.437 ... 69. . doi : 10.1038 / nature04072 . PMID 16136131 .
Calculamos que la divergencia de nucleótidos en todo el genoma entre humanos y chimpancés es del 1,23%, lo que confirma los resultados recientes de estudios más limitados.
- ^ La secuenciación del chimpancé; Consorcio de análisis (septiembre de 2005). "Secuencia inicial del genoma del chimpancé y comparación con el genoma humano" . Naturaleza . 437 (7055): 69–87. Código Bibliográfico : 2005Natur.437 ... 69. . doi : 10.1038 / nature04072 . PMID 16136131 .
estimamos que el polimorfismo representa el 14-22% de la tasa de divergencia observada y, por lo tanto, la divergencia fija es ~ 1.06% o menos
- ^ Demuth JP, De Bie T, Stajich JE, Cristianini N, Hahn MW (2006). "La evolución de las familias de genes de mamíferos" . PLOS ONE . 1 (1): e85. Código bibliográfico : 2006PLoSO ... 1 ... 85D . doi : 10.1371 / journal.pone.0000085 . PMC 1762380 . PMID 17183716 .
Nuestros resultados implican que los humanos y los chimpancés difieren en al menos un 6% (1.418 de 22.000 genes) en su complemento de genes, lo que contrasta con la diferencia del 1,5%, frecuentemente citada, entre las secuencias de nucleótidos ortólogas.
- ^ La secuenciación del chimpancé; Consorcio de análisis (septiembre de 2005). "Secuencia inicial del genoma del chimpancé y comparación con el genoma humano" . Naturaleza . 437 (7055): 69–87. Código Bibliográfico : 2005Natur.437 ... 69. . doi : 10.1038 / nature04072 . PMID 16136131 .
El cromosoma 2 humano resultó de una fusión de dos cromosomas ancestrales que permanecieron separados en el linaje de los chimpancés.
Olson MV, Varki A (enero de 2003). "Secuenciación del genoma del chimpancé: conocimientos sobre la evolución humana y la enfermedad". Nature Reviews Genética . 4 (1): 20–8. doi : 10.1038 / nrg981 . PMID 12509750 . S2CID 205486561 .La secuenciación a gran escala del genoma del chimpancé es ahora inminente.
- ^ Gilad Y, Wiebe V, Przeworski M, Lancet D, Pääbo S (enero de 2004). "La pérdida de genes receptores olfativos coincide con la adquisición de visión tricromática completa en primates" . PLOS Biología . 2 (1): E5. doi : 10.1371 / journal.pbio.0020005 . PMC 314465 . PMID 14737185 .
Nuestros hallazgos sugieren que el deterioro del repertorio olfativo ocurrió concomitantemente con la adquisición de una visión cromática tricromática completa en primates.
- ^ Zimmer C (21 de septiembre de 2016). "Cómo llegamos aquí: puntos de ADN a una única migración desde África" . New York Times . Consultado el 22 de septiembre de 2016 .
- ^ Copeland WC (enero de 2012). "Defectos en la replicación del ADN mitocondrial y enfermedad humana" . Revisiones críticas en bioquímica y biología molecular . 47 (1): 64–74. doi : 10.3109 / 10409238.2011.632763 . PMC 3244805 . PMID 22176657 .
- ^ Nielsen R, Akey JM, Jakobsson M, Pritchard JK, Tishkoff S, Willerslev E (enero de 2017). "Trazando el poblamiento del mundo a través de la genómica" . Naturaleza . 541 (7637): 302–310. Código Bib : 2017Natur.541..302N . doi : 10.1038 / nature21347 . PMC 5772775 . PMID 28102248 .
- ^ Sykes B (9 de octubre de 2003). "ADN mitocondrial e historia humana" . El genoma humano. Archivado desde el original el 7 de septiembre de 2015 . Consultado el 19 de septiembre de 2006 .
- ^ Misteli T (febrero de 2007). "Más allá de la secuencia: organización celular de la función del genoma". Celular . 128 (4): 787–800. doi : 10.1016 / j.cell.2007.01.028 . PMID 17320514 . S2CID 9064584 .
- ^ Bernstein BE, Meissner A, Lander ES (febrero de 2007). "El epigenoma de los mamíferos". Celular . 128 (4): 669–81. doi : 10.1016 / j.cell.2007.01.033 . PMID 17320505 . S2CID 2722988 .
- ^ Scheen AJ, Junien C (mayo-junio de 2012). "[Epigenética, interfaz entre medio ambiente y genes: papel en enfermedades complejas]". Revue Médicale de Liège . 67 (5–6): 250–7. PMID 22891475 .
enlaces externos
- Ensembl The Ensembl Genome Browser Project
- Visor del genoma humano de la Biblioteca Nacional de Medicina
- Navegador UCSC Genome .
- Proyecto Genoma Humano .
- El Instituto Nacional de Investigación del Genoma Humano * La Oficina Nacional de Genómica de Salud Pública
- Visor simple del genoma humano