Un segmento de ADN es idéntico por estado (IBS) en dos o más individuos si tienen secuencias de nucleótidos idénticas en este segmento. Un segmento de IBS es idéntico por descendencia ( IBD ) en dos o más individuos si lo han heredado de un ancestro común sin recombinación , es decir, el segmento tiene el mismo origen ancestral en estos individuos. Los segmentos de ADN que son IBD son IBS por definición, pero los segmentos que no son IBD aún pueden ser IBS debido a las mismas mutaciones en diferentes individuos o recombinaciones que no alteran el segmento.
Teoría
Todos los individuos de una población finita están relacionados si se remontan lo suficiente y, por lo tanto, compartirán segmentos de sus genomas EII. Durante la meiosis, los segmentos de la EII se rompen por recombinación. Por lo tanto, la longitud esperada de un segmento de IBD depende del número de generaciones desde el ancestro común más reciente en el locus del segmento. La longitud de los segmentos de EII que resultan de un ancestro común n generaciones en el pasado (por lo tanto, involucra 2 n meiosis) se distribuye exponencialmente con una media de 1 / (2 n ) Morgan (M). [1] El número esperado de segmentos de EII disminuye con el número de generaciones desde el ancestro común en este locus. Para un segmento de ADN específico, la probabilidad de ser EII disminuye en 2 -2 n ya que en cada meiosis la probabilidad de transmitir este segmento es 1/2. [2]
Aplicaciones
Los segmentos de IBD identificados se pueden utilizar para una amplia gama de propósitos. Como se señaló anteriormente, la cantidad (duración y número) de la EII que se comparte depende de las relaciones familiares entre los individuos evaluados. Por lo tanto, una aplicación de la detección de segmentos de EII es cuantificar la relación. [3] [4] [5] [6] La medición de parentesco se puede utilizar en genética forense , [7] pero también puede aumentar la información en el mapeo de ligamiento genético [3] [8] y ayudar a disminuir el sesgo por relaciones indocumentadas en estándares estudios de asociación . [6] [9] Otra aplicación de la EII es la imputación del genotipo y la inferencia de la fase del haplotipo . [10] [11] [12] Los segmentos compartidos largos de EII, que están divididos por regiones cortas, pueden ser indicativos de errores de fase. [5] [13] : SI
Mapeo de EII
El mapeo de EII [3] es similar al análisis de ligamiento, pero se puede realizar sin un pedigrí conocido en una cohorte de individuos no emparentados. El mapeo de la EII puede verse como una nueva forma de análisis de asociación que aumenta el poder de mapear genes o regiones genómicas que contienen múltiples variantes de susceptibilidad a enfermedades raras. [6] [14]
Utilizando datos simulados, Browning y Thompson demostraron que el mapeo de la EII tiene mayor poder que las pruebas de asociación cuando múltiples variantes raras dentro de un gen contribuyen a la susceptibilidad a la enfermedad. [14] A través del mapeo de la EII, se encontraron regiones significativas de todo el genoma en poblaciones aisladas, así como en poblaciones exógenas, mientras que las pruebas de asociación estándar fallaron. [11] [15] Houwen y col. utilizó el intercambio de EII para identificar la ubicación cromosómica de un gen responsable de la colestasis intrahepática recurrente benigna en una población pesquera aislada. [16] Kenny y col. también usó una población aislada para mapear con precisión una señal encontrada por un estudio de asociación de todo el genoma (GWAS) de los niveles de esterol vegetal en plasma (PPS), una medida sustituta de la absorción de colesterol en el intestino. [17] Francks y col. pudo identificar un locus de susceptibilidad potencial para la esquizofrenia y el trastorno bipolar con datos de genotipo de muestras de casos y controles. [18] Lin y col. encontró una señal de vinculación significativa en todo el genoma en un conjunto de datos de pacientes con esclerosis múltiple . [19] Letouzé y col. utilizó el mapeo de la EII para buscar mutaciones fundadoras en muestras de cáncer . [20]
EII en genética de poblaciones
La detección de la selección natural en el genoma humano también es posible mediante segmentos de IBD detectados. Por lo general, la selección tenderá a aumentar el número de segmentos de EII entre los individuos de una población. Mediante la exploración de regiones con un exceso de distribución de EII, se pueden identificar las regiones del genoma humano que han estado sometidas a una selección fuerte y muy reciente. [21] [22]
Además de eso, los segmentos de EII pueden ser útiles para medir e identificar otras influencias en la estructura de la población. [6] [23] [24] [25] [26] Gusev y col. mostró que los segmentos de EII se pueden utilizar con modelos adicionales para estimar el historial demográfico, incluidos los cuellos de botella y la mezcla . [24] Utilizando modelos similares Palamara et al. y Carmi et al. reconstruyó la historia demográfica de los judíos asquenazíes y los masai de Kenia . [25] [26] [27] Botigué et al. investigó las diferencias en la ascendencia africana entre las poblaciones europeas. [28] Ralph y Coop utilizaron la detección de EII para cuantificar la ascendencia común de diferentes poblaciones europeas [29] y Gravel et al. De manera similar, trató de sacar conclusiones de la historia genética de las poblaciones de las Américas. [30] Ringbauer y col. utilizó la estructura geográfica de los segmentos de EII para estimar la dispersión dentro de Europa del Este durante los últimos siglos. [31] Utilizando los datos de 1000 genomas , Hochreiter encontró diferencias en el intercambio de EII entre las poblaciones africanas, asiáticas y europeas, así como en los segmentos de EII que se comparten con genomas antiguos como el neandertal o el denisova . [13]
Métodos y software
Programas para la detección de segmentos de EII en personas no relacionadas:
- RAPID : Identidad ultrarrápida por detección de descenso en cohortes a escala de biobanco utilizando la transformada posicional Burrows-Wheeler [32]
- Parente : identifica segmentos de EII entre pares de individuos en datos de genotipo sin fase [33]
- BEAGLE / fastIBD : encuentra segmentos de EII entre pares de individuos en datos de SNP de todo el genoma [34]
- BEAGLE / RefinedIBD : encuentra segmentos de EII en pares de individuos utilizando un método de hash y evalúa su importancia a través de una razón de verosimilitud [35]
- IBDseq : detecta segmentos de EII por pares en datos de secuenciación [36]
- GERMLINE : descubre segmentos de EII en tiempo lineal en pares de individuos [5]
- DASH : se basa en segmentos de EII por pares para inferir grupos de individuos que probablemente compartan un solo haplotipo [15]
- PLINK : es un conjunto de herramientas para la asociación del genoma completo y los análisis de vinculación basados en la población que incluye un método para la detección de segmentos de EII por pares [6]
- Relacionar : estima la probabilidad de EII entre pares de individuos en un locus específico usando SNPs [3]
- MCMC_IBDfinder : se basa en la cadena de Markov Monte Carlo (MCMC) para encontrar segmentos de EII en varios individuos [37]
- IBD-Groupon : detecta segmentos de IBD por grupo según las relaciones de IBD por pares [38]
- HapFABIA : identifica segmentos de EII muy cortos caracterizados por variantes raras en grandes datos de secuenciación simultáneamente en varios individuos [13]
Ver también
- Mapeo de asociaciones
- Asociación genética
- Ligamiento genético
- Estudio de asociación de genoma completo
- Identidad por tipo
- Desequilibrio de ligamiento
- Genética de poblaciones
Referencias
- ^ Browning, SR (2008). "Estimación de la identidad por pares por descenso a partir de datos de marcadores genéticos densos en una muestra de población de haplotipos" . Genética . 178 (4): 2123–2132. doi : 10.1534 / genetics.107.084624 . PMC 2323802 . PMID 18430938 .
- ^ Thompson, EA (2008). "El proceso de la EII a lo largo de cuatro cromosomas" . Biología teórica de poblaciones . 73 (3): 369–373. doi : 10.1016 / j.tpb.2007.11.011 . PMC 2518088 . PMID 18282591 .
- ^ a b c d Albrechtsen, A .; Sand Korneliussen, T .; Moltke, I .; Van Overseem Hansen, T .; Nielsen, FC; Nielsen, R. (2009). "Mapeo de parentesco y tractos de parentesco para datos de todo el genoma en presencia de desequilibrio de ligamiento". Epidemiología genética . 33 (3): 266-274. doi : 10.1002 / gepi.20378 . PMID 19025785 .
- ^ Browning, SR; Browning, BL (2010). "Detección de alta resolución de la identidad por ascendencia en personas no relacionadas" . La Revista Estadounidense de Genética Humana . 86 (4): 526–539. doi : 10.1016 / j.ajhg.2010.02.021 . PMC 2850444 . PMID 20303063 .
- ^ a b c Gusev, A .; Lowe, JK; Stoffel, M .; Daly, MJ; Altshuler, D .; Breslow, JL; Friedman, JM; Pe'Er, I. (2008). "Toda la población, mapeo de todo el genoma de parentesco oculto" . Investigación del genoma . 19 (2): 318–326. doi : 10.1101 / gr.081398.108 . PMC 2652213 . PMID 18971310 .
- ^ a b c d e Purcell, S .; Neale, B .; Todd-Brown, K .; Thomas, L .; Ferreira, MAR; Bender, D .; Maller, J .; Sklar, P .; De Bakker, PIW; Daly, MJ; Sham, PC (2007). "PLINK: un conjunto de herramientas para la asociación de genoma completo y análisis de vinculación basados en la población" . La Revista Estadounidense de Genética Humana . 81 (3): 559–575. doi : 10.1086 / 519795 . PMC 1950838 . PMID 17701901 .
- ^ Ian W. Evett; Bruce S. Weir (enero de 1998). Interpretación de la evidencia del ADN: genética estadística para científicos forenses . Sinauer Associates, Incorporated. ISBN 978-0-87893-155-2.
- ^ Leutenegger, A .; Prum, B .; Genin, E .; Verny, C .; Lemainque, A .; Clergetdarpoux, F .; Thompson, E. (2003). "Estimación del coeficiente de consanguinidad mediante el uso de datos genómicos" . La Revista Estadounidense de Genética Humana . 73 (3): 516–523. doi : 10.1086 / 378207 . PMC 1180677 . PMID 12900793 .
- ^ Voight, BF; Pritchard, JK (2005). "Confusión de la relación críptica en estudios de asociación de casos y controles" . PLOS Genetics . 1 (3): e32. doi : 10.1371 / journal.pgen.0010032 . PMC 1200427 . PMID 16151517 .
- ^ Kong, A .; Masson, G .; Frigge, ML; Gylfason, A .; Zusmanovich, P .; Thorleifsson, G .; Olason, PI; Ingason, A .; Steinberg, S .; Rafnar, T .; Sulem, P .; Mouy, M .; Jonsson, F .; Thorsteinsdottir, U .; Gudbjartsson, DF; Stefansson, H .; Stefansson, K. (2008). "Detección de compartir por descendencia, fase de largo alcance e imputación de haplotipos" . Genética de la naturaleza . 40 (9): 1068–1075. doi : 10.1038 / ng.216 . PMC 4540081 . PMID 19165921 .
- ^ a b Gusev, A .; Shah, MJ; Kenny, EE; Ramachandran, A .; Lowe, JK; Salit, J .; Lee, CC; Levandowsky, EC; Weaver, TN; Doan, QC; Peckham, ÉL; McLaughlin, SF; Lyons, MR; Sheth, VN; Stoffel, M .; De La Vega, FM; Friedman, JM; Breslow, JL; Pe'Er, I. (2011). "Secuenciación de paso bajo en todo el genoma e inferencia de variantes utilizando identidad por descendencia en una población humana aislada" . Genética . 190 (2): 679–689. doi : 10.1534 / genetics.111.134874 . PMC 3276614 . PMID 22135348 .
- ^ Browning, BL; Browning, SR (2009). "Un enfoque unificado para la imputación de genotipo y la inferencia de fase de haplotipo para grandes conjuntos de datos de tríos e individuos no relacionados" . La Revista Estadounidense de Genética Humana . 84 (2): 210-223. doi : 10.1016 / j.ajhg.2009.01.005 . PMC 2668004 . PMID 19200528 .
- ^ a b c Hochreiter, S. (2013). "HapFABIA: Identificación de segmentos muy cortos de identidad por descendencia caracterizados por variantes raras en grandes datos de secuenciación" . Investigación de ácidos nucleicos . 41 (22): e202. doi : 10.1093 / nar / gkt1013 . PMC 3905877 . PMID 24174545 .
- ^ a b Browning, SR; Thompson, EA (2012). "Detección de asociaciones de variantes raras por mapeo de identidad por descendencia en estudios de casos y controles" . Genética . 190 (4): 1521-1531. doi : 10.1534 / genetics.111.136937 . PMC 3316661 . PMID 22267498 .
- ^ a b Gusev, A .; Kenny, EE; Lowe, JK; Salit, J .; Saxena, R .; Kathiresan, S .; Altshuler, DM; Friedman, JM; Breslow, JL; Pe'Er, I. (2011). "DASH: un método para el mapeo de haplotipos idénticos por descendencia descubre asociación con variación reciente" . La Revista Estadounidense de Genética Humana . 88 (6): 706–717. doi : 10.1016 / j.ajhg.2011.04.023 . PMC 3113343 . PMID 21620352 .
- ^ Houwen, RHJ; Baharloo, S .; Blankenship, K .; Raeymaekers, P .; Juyn, J .; Sandkuijl, LA; Freimer, NB (1994). "Cribado del genoma mediante la búsqueda de segmentos compartidos: mapeo de un gen para la colestasis intrahepática recurrente benigna" . Genética de la naturaleza . 8 (4): 380–386. doi : 10.1038 / ng1294-380 . hdl : 1765/55192 . PMID 7894490 .
- ^ Kenny, EE; Gusev, A .; Riegel, K .; Lutjohann, D .; Lowe, JK; Salit, J .; Maller, JB; Stoffel, M .; Daly, MJ; Altshuler, DM; Friedman, JM; Breslow, JL; Pe'Er, I .; Sehayek, E. (2009). "El análisis sistemático de haplotipos resuelve un locus de esteroles de plantas de plasma complejo en la isla de Kosrae de Micronesia" . Actas de la Academia Nacional de Ciencias . 106 (33): 13886-13891. doi : 10.1073 / pnas.0907336106 . PMC 2728990 . PMID 19667188 .
- ^ Francks, C .; Tozzi, F .; Farmer, A .; Vincent, JB; Rujescu, D .; St Clair, D .; Muglia, P. (2008). "El análisis de vinculación basado en la población de la esquizofrenia y las cohortes de casos y controles bipolares identifica un locus de susceptibilidad potencial en 19q13" . Psiquiatría molecular . 15 (3): 319–325. doi : 10.1038 / mp.2008.100 . PMID 18794890 .
- ^ Lin, R .; Charlesworth, J .; Stankovich, J .; Perreau, VM; Brown, MA; Anzgene, BV; Taylor, BV (2013). Toland, Amanda Ewart (ed.). "Mapeo de identidad por descendencia para detectar variantes raras que confieren susceptibilidad a la esclerosis múltiple" . PLOS ONE . 8 (3): e56379. doi : 10.1371 / journal.pone.0056379 . PMC 3589405 . PMID 23472070 .
- ^ Letouzé, E .; Sow, A .; Petel, F .; Rosati, R .; Figueiredo, BC; Burnichon, N .; Gimenez-Roqueplo, AP; Lalli, E .; De Reyniès, AL (2012). Mailund, Thomas (ed.). "Identidad por mapeo descendente de mutaciones fundadoras en cáncer utilizando datos de SNP tumorales de alta resolución" . PLOS ONE . 7 (5): e35897. doi : 10.1371 / journal.pone.0035897 . PMC 3342326 . PMID 22567117 .
- ^ Albrechtsen, A .; Moltke, I .; Nielsen, R. (2010). "Selección natural y distribución de la identidad por descendencia en el genoma humano" . Genética . 186 (1): 295-308. doi : 10.1534 / genetics.110.113977 . PMC 2940294 . PMID 20592267 .
- ^ Han, L .; Abney, M. (2011). "Identidad por estimación de descendencia con datos de genotipo denso de todo el genoma" . Epidemiología genética . 35 (6): 557–567. doi : 10.1002 / gepi.20606 . PMC 3587128 . PMID 21769932 .
- ^ Cockerham, CC; Weir, BS (1983). "Varianza de la consanguinidad real". Biología teórica de poblaciones . 23 (1): 85–109. doi : 10.1016 / 0040-5809 (83) 90006-0 . PMID 6857551 .
- ^ a b Gusev, A .; Palamara, PF; Aponte, G .; Zhuang, Z .; Darvasi, A .; Gregersen, P .; Pe'Er, I. (2011). "La arquitectura de haplotipos de largo alcance compartidos dentro y entre poblaciones" . Biología Molecular y Evolución . 29 (2): 473–486. doi : 10.1093 / molbev / msr133 . PMC 3350316 . PMID 21984068 .
- ^ a b Palamara, PF; Lencz, T .; Darvasi, A .; Pe'Er, I. (2012). "Las distribuciones de longitud de la identidad por ascendencia revelan la historia demográfica a escala fina" . La Revista Estadounidense de Genética Humana . 91 (5): 809–822. doi : 10.1016 / j.ajhg.2012.08.030 . PMC 3487132 . PMID 23103233 .
- ^ a b Palamara, PF; Pe'Er, I. (2013). "Inferencia de las tasas de migración histórica a través del intercambio de haplotipos" . Bioinformática . 29 (13): i180 – i188. doi : 10.1093 / bioinformatics / btt239 . PMC 3694674 . PMID 23812983 .
- ^ Carmi, S .; Palamara, PF; Vacic, V .; Lencz, T .; Darvasi, A .; Pe'Er, I. (2012). "La varianza de compartir identidad por descendencia en el modelo de Wright-Fisher" . Genética . 193 (3): 911–928. doi : 10.1534 / genetics.112.147215 . PMC 3584006 . PMID 23267057 .
- ^ Botigue, LR; Henn, BM; Grava, S .; Maples, BK; Gignoux, CR; Corona, E .; Atzmon, G .; Burns, E .; Ostrer, H .; Flores, C .; Bertranpetit, J .; Comas, D .; Bustamante, CD (2013). "El flujo de genes del norte de África contribuye a la diversidad genética humana diferencial en el sur de Europa" . Actas de la Academia Nacional de Ciencias . 110 (29): 11791-11796. doi : 10.1073 / pnas.1306223110 . PMC 3718088 . PMID 23733930 .
- ^ Ralph, P .; Coop, G. (2013). Tyler-Smith, Chris (ed.). "La geografía de la ascendencia genética reciente en Europa" . PLOS Biología . 11 (5): e1001555. doi : 10.1371 / journal.pbio.1001555 . PMC 3646727 . PMID 23667324 .
- ^ Grava, S .; Zakharia, F .; Moreno-Estrada, A .; Byrnes, JK; Muzzio, M .; Rodríguez-Flores, JL; Kenny, EE; Gignoux, CR; Maples, BK; Guiblet, W .; Dutil, J .; Via, M .; Sandoval, K .; Bedoya, G .; 1000 genomas, TK; Oleksyk, A .; Ruiz-Linares, EG; Burchard, JC; Martínez-Cruzado, CD; Bustamante, CD (2013). Williams, Scott M (ed.). "Reconstrucción de las migraciones de nativos americanos a partir de datos de todo el genoma y todo el exoma" . PLOS Genetics . 9 (12): e1004023. doi : 10.1371 / journal.pgen.1004023 . PMC 3873240 . PMID 24385924 .
- ^ Ringbauer, Harald; Coop, Graham; Barton, Nicholas H. (1 de marzo de 2017). "Inferir demografía reciente a partir del aislamiento por distancia de bloques de secuencia compartidos largos" . Genética . 205 (3): 1335-1351. doi : 10.1534 / genetics.116.196220 . ISSN 0016-6731 . PMC 5340342 . PMID 28108588 .
- ^ Naseri A, Liu X, Zhang S, Zhi D. Identidad ultrarrápida por detección de descenso en cohortes a escala de biobanco utilizando la transformación de Burrows-Wheeler posicional BioRxiv 2017.
- ^ Rodríguez JM, Batzoglou S, Bercovici S. Un método preciso para inferir parentesco en grandes conjuntos de datos de genotipos sin fases a través de una prueba de razón de verosimilitud incrustada. RECOMBAR 2013, LNBI 7821: 212-229.
- ^ Browning, BL; Browning, SR (2011). "Un método rápido y potente para detectar la identidad por ascendencia" . La Revista Estadounidense de Genética Humana . 88 (2): 173–182. doi : 10.1016 / j.ajhg.2011.01.010 . PMC 3035716 . PMID 21310274 .
- ^ Browning, BL; Browning, SR (2013). "Mejora de la precisión y eficiencia de la detección de identidad por descendencia en datos de población" . Genética . 194 (2): 459–471. doi : 10.1534 / genetics.113.150029 . PMC 3664855 . PMID 23535385 .
- ^ Browning, BL; Browning, SR (2013). "Detección de identidad por descenso y estimación de tasas de error de genotipo en datos de secuencia" . La Revista Estadounidense de Genética Humana . 93 (5): 840–851. doi : 10.1016 / j.ajhg.2013.09.014 . PMC 3824133 . PMID 24207118 .
- ^ Moltke, I .; Albrechtsen, A .; Hansen, TVO; Nielsen, FC; Nielsen, R. (2011). "Un método para detectar regiones IBD simultáneamente en múltiples individuos - con aplicaciones a la genética de enfermedades" . Investigación del genoma . 21 (7): 1168-1180. doi : 10.1101 / gr.115360.110 . PMC 3129259 . PMID 21493780 .
- ^ Él, D. (2013). "IBD-Groupon: un método eficaz para detectar regiones de identidad por descendencia de grupo de forma simultánea en varios individuos en función de las relaciones de IBD por pares" . Bioinformática . 29 (13): i162 – i170. doi : 10.1093 / bioinformatics / btt237 . PMC 3694672 . PMID 23812980 .