En genética de poblaciones , el desequilibrio de ligamiento ( LD ) es la asociación no aleatoria de alelos en diferentes loci en una población determinada. Se dice que los loci están en desequilibrio de ligamiento cuando la frecuencia de asociación de sus diferentes alelos es mayor o menor de lo que se esperaría si los loci fueran independientes y se asociaran al azar. [1]
El desequilibrio de ligamiento se ve influida por muchos factores, incluyendo la selección , la tasa de recombinación genética , la tasa de mutación , deriva genética , el sistema de apareamiento , estructura de la población , y la vinculación genética . Como resultado, el patrón de desequilibrio de ligamiento en un genoma es una señal poderosa de los procesos genéticos poblacionales que lo están estructurando.
A pesar de su nombre, el desequilibrio de ligamiento puede existir entre alelos en diferentes loci sin ningún vínculo genético entre ellos e independientemente de si las frecuencias de los alelos están en equilibrio o no (no cambian con el tiempo). [1] Además, el desequilibrio de ligamiento a veces se denomina desequilibrio de fase gamética ; [2] sin embargo, el concepto también se aplica a organismos asexuales y, por lo tanto, no depende de la presencia de gametos .
Definicion formal
Suponga que entre los gametos que se forman en una población que se reproduce sexualmente, el alelo A ocurre con frecuencia en un locus (es decir es la proporción de gametos con A en ese locus), mientras que en un locus diferente el alelo B ocurre con frecuencia. Del mismo modo, dejemosser la frecuencia con la que tanto A como B ocurren juntos en el mismo gameto (es decir,es la frecuencia del haplotipo AB ).
La asociación entre los alelos A y B puede considerarse completamente aleatoria, lo que en estadística se conoce como independencia, cuando la ocurrencia de uno no afecta la ocurrencia del otro, en cuyo caso la probabilidad de que tanto A como B ocurran juntos es dado por el producto de las probabilidades. Se dice que existe un desequilibrio de ligamiento entre los dos alelos siempre que difiere de por alguna razon.
El nivel de desequilibrio de ligamiento entre A y B se puede cuantificar mediante el coeficiente de desequilibrio de ligamiento , que se define como
siempre que ambos y son mayores que cero. El desequilibrio de ligamiento corresponde a. En el caso tenemos y se dice que los alelos A y B están en equilibrio de ligamiento . El subíndice "AB" enenfatiza que el desequilibrio de ligamiento es una propiedad del par { A , B } de alelos y no de sus respectivos loci. Otros pares de alelos en esos mismos dos loci pueden tener diferentes coeficientes de desequilibrio de ligamiento.
Para dos loci bialélicos, donde ayb son los otros alelos en estos dos loci, las restricciones son tan fuertes que solo un valor de D es suficiente para representar todas las relaciones de desequilibrio de ligamiento entre estos alelos. En este caso,. Sus relaciones se pueden caracterizar de la siguiente manera. [3]
El signo de D en este caso se elige arbitrariamente. La magnitud de D es más importante que el signo de D porque la magnitud de D es representativa del grado de desequilibrio de ligamiento. [4] Sin embargo, el valor D positivo significa que el gameto es más frecuente de lo esperado, mientras que negativo significa que la combinación de estos dos alelos es menos frecuente de lo esperado.
El desequilibrio de ligamiento en poblaciones asexuales se puede definir de manera similar en términos de frecuencias de alelos poblacionales. Además, también es posible definir el desequilibrio de ligamiento entre tres o más alelos, sin embargo, estas asociaciones de orden superior no se usan comúnmente en la práctica. [1]
Medidas derivadas de
El coeficiente de desequilibrio de ligamiento no siempre es una medida conveniente del desequilibrio de ligamiento porque su rango de valores posibles depende de las frecuencias de los alelos a los que se refiere. Esto hace que sea difícil comparar el nivel de desequilibrio de ligamiento entre diferentes pares de alelos.
Lewontin [5] sugirió normalizar D dividiéndolo por la diferencia máxima teórica entre las frecuencias de haplotipos observadas y esperadas de la siguiente manera:
dónde
Una alternativa a es el coeficiente de correlación entre pares de loci, expresado como
Ejemplo: dos loci y dos alelos
Considere los haplotipos para dos loci A y B con dos alelos cada uno: un modelo de dos loci y dos alelos. Luego, la siguiente tabla define las frecuencias de cada combinación:
Haplotipo | Frecuencia |
Tenga en cuenta que estas son frecuencias relativas . Se pueden usar las frecuencias anteriores para determinar la frecuencia de cada uno de los alelos:
Alelo | Frecuencia |
Si los dos loci y los alelos son independientes entre sí, entonces se puede expresar la observación como " se encuentra y se encuentra ". La tabla anterior enumera las frecuencias para , , y para, , de ahí la frecuencia de es , y de acuerdo con las reglas de la estadística elemental .
La desviación de la frecuencia observada de un haplotipo de la esperada es una cantidad [6] llamada desequilibrio de ligamiento [7] y comúnmente se denota con una D mayúscula :
La siguiente tabla ilustra la relación entre las frecuencias de los haplotipos y las frecuencias alélicas y D.
Total | |||
Total |
Papel de la recombinación
En ausencia de fuerzas evolutivas distintas del apareamiento aleatorio , segregación mendeliana , surtido cromosómico aleatorio y cruce cromosómico (es decir, en ausencia de selección natural , endogamia y deriva genética ), la medida de desequilibrio de ligamiento converge a cero a lo largo del eje del tiempo a una tasa que depende de la magnitud de la tasa de recombinación entre los dos loci.
Usando la notación anterior, , podemos demostrar esta convergencia a cero de la siguiente manera. En la próxima generación,, la frecuencia del haplotipo , se convierte en
Esto sigue porque una fracción de los haplotipos en la descendencia no se han recombinado y, por lo tanto, son copias de un haplotipo aleatorio en sus padres. Una fracción de esos son . Una fracciónhan recombinado estos dos loci. Si los padres resultan de un apareamiento aleatorio, la probabilidad de la copia en el locus tener alelo es y la probabilidad de la copia en el lugar tener alelo es , y como estas copias se encuentran inicialmente en los dos gametos diferentes que formaron el genotipo diploide, estos son eventos independientes por lo que las probabilidades se pueden multiplicar.
Esta fórmula se puede reescribir como
así que eso
dónde en el -a generación se designa como . Así tenemos
Si , luego así que eso converge a cero.
Si en algún momento observamos un desequilibrio de ligamiento, desaparecerá en el futuro debido a la recombinación. Sin embargo, cuanto menor sea la distancia entre los dos loci, menor será la tasa de convergencia de a cero.
Ejemplo: alelos del antígeno leucocitario humano (HLA)
HLA constituye un grupo de antígenos de superficie celular también conocido como MHC de humanos. Debido a que los genes HLA están ubicados en loci adyacentes en la región particular de un cromosoma y se presume que exhiben epistasis entre sí o con otros genes, una fracción considerable de alelos está en desequilibrio de ligamiento.
Un ejemplo de tal desequilibrio de ligamiento es entre los alelos HLA-A1 y B8 en daneses no emparentados [8] mencionados por Vogel y Motulsky (1997). [9]
Antígeno j | Total | ||||
---|---|---|---|---|---|
Antígeno i | |||||
Total | |||||
No. de individuos |
Debido a que el HLA es codominante y la expresión de HLA solo se prueba locus por locus en las encuestas, la medida de LD debe estimarse a partir de una tabla de 2 × 2 a la derecha. [9] [10] [11] [12]
expresión () frecuencia de antígeno :
expresión () frecuencia de antígeno :
frecuencia del gen , dado que los individuos con genotipos '+/−', '+ / +' y '- / +' son todos positivos para el antígeno :
y
Denotando los alelos '-' en el antígeno i como x , y en el antígeno j como y , la frecuencia observada del haplotipo xy es
y la frecuencia estimada del haplotipo xy es
Entonces LD medida se expresa como
Errores estándar se obtienen de la siguiente manera:
Entonces sí
excede 2 en su valor absoluto, la magnitud de es estadísticamente significativamente grande. Para los datos de la Tabla 1 es 20,9, por lo que se admite la existencia de LD estadísticamente significativa entre A1 y B8 en la población.
Alelos HLA-A i | Alelos HLA-B j | ||
---|---|---|---|
A1 | B8 | 0,065 | 16,0 |
A3 | B7 | 0.039 | 10,3 |
A2 | Bw40 | 0.013 | 4.4 |
A2 | Bw15 | 0,01 | 3.4 |
A1 | Bw17 | 0,014 | 5.4 |
A2 | B18 | 0,006 | 2.2 |
A2 | Bw35 | −0,009 | −2,3 |
A29 | B12 | 0.013 | 6.0 |
A10 | Bw16 | 0.013 | 5.9 |
La Tabla 2 muestra algunas de las combinaciones de alelos HLA-A y B donde se observó LD significativa entre los paneuropeos. [12]
Vogel y Motulsky (1997) [9] argumentaron cuánto tardaría en desaparecer el desequilibrio de enlace entre los loci de HLA-A y B. Se consideró que la recombinación entre los loci de HLA-A y B era del orden de magnitud 0,008. Argumentaremos de manera similar a Vogel y Motulsky a continuación. En el caso de que se haya observado que la medida de LD es 0,003 en los paneuropeos de la lista de Mittal [12] , la mayoría de las veces no es significativa. Si se había reducido de 0.07 a 0.003 bajo el efecto de recombinación como se muestra por , luego . Supongamos que una generación tomó 25 años, esto significa 10,000 años. El lapso de tiempo parece bastante corto en la historia de los humanos. Por tanto, el desequilibrio de ligamiento observado entre los loci HLA-A y B podría indicar algún tipo de selección interactiva. [9]
La presencia de desequilibrio de ligamiento entre un locus HLA y un supuesto gen principal de susceptibilidad a la enfermedad corresponde a cualquiera de los siguientes fenómenos:
- El riesgo relativo de que la persona que tiene un alelo HLA específico padezca una enfermedad en particular es mayor que 1. [13]
- La frecuencia del antígeno HLA entre los pacientes supera más que entre una población sana. Esto es evaluado porvalor [14] para exceder 0.
Espondiloartritis anquilosante | Total | |||
---|---|---|---|---|
Pacientes | Controles saludables | |||
Alelos HLA | ||||
Total |
- La tabla de asociación 2 × 2 de pacientes y controles sanos con alelos HLA muestra una desviación significativa del estado de equilibrio deducido de las frecuencias marginales.
(1) Riesgo relativo
El riesgo relativo de un alelo HLA para una enfermedad se aproxima mediante la razón de probabilidades en la tabla de asociación 2 × 2 del alelo con la enfermedad. La Tabla 3 muestra la asociación de HLA-B27 con espondilitis anquilosante en una población holandesa. [15] Riesgo relativode este alelo se aproxima por
Se aplica el método de Woolf [16] para ver si hay significación estadística. Dejar
y
Luego
sigue la distribución chi-cuadrado con . En los datos de la Tabla 3, existe una asociación significativa al nivel del 0.1%. La modificación de Haldane [17] se aplica al caso en que cualquiera de es cero, donde y son reemplazados por
y
respectivamente.
Enfermedad | Alelo HLA | Riesgo relativo (%) | MODA (%) | FAP (%) | |
---|---|---|---|---|---|
Espondiloartritis anquilosante | B27 | 90 | 90 | 8 | 0,89 |
Artritis reactiva | B27 | 40 | 70 | 8 | 0,67 |
Espondilitis en la enfermedad inflamatoria intestinal | B27 | 10 | 50 | 8 | 0,46 |
Artritis Reumatoide | DR4 | 6 | 70 | 30 | 0,57 |
Lupus eritematoso sistémico | DR3 | 3 | 45 | 20 | 0,31 |
Esclerosis múltiple | DR2 | 4 | 60 | 20 | 0,5 |
Diabetes mellitus tipo 1 | DR4 | 6 | 75 | 30 | 0,64 |
En la Tabla 4, se presentan algunos ejemplos de asociación entre alelos HLA y enfermedades. [13]
(1a) Exceso de frecuencia de alelos entre pacientes sobre controles
Incluso se observaron riesgos relativos altos entre los alelos HLA y las enfermedades, solo la magnitud del riesgo relativo no podría determinar la fuerza de la asociación. [14] el valor se expresa por
dónde y son las frecuencias alélicas de HLA entre pacientes y poblaciones sanas, respectivamente. [14] En el cuadro 4,Se agregó una columna en esta cita. Dejando a un lado 2 enfermedades con altos riesgos relativos, las cuales también tienen altos valores, entre otras enfermedades, la diabetes mellitus juvenil (tipo 1) tiene una fuerte asociación con DR4 incluso con un riesgo relativo bajo.
(2) Discrepancias de los valores esperados de las frecuencias marginales en la tabla de asociación 2 × 2 de alelos HLA y enfermedad
Esto puede ser confirmado por prueba de cálculo
dónde . Para datos con un tamaño de muestra pequeño, como que ningún total marginal sea mayor que 15 (y, en consecuencia,), se debe utilizar la corrección de Yates para la continuidad o la prueba exacta de Fisher . [18]
Recursos
Devlin & Risch proporcionan una comparación de diferentes medidas de LD [19].
El Proyecto Internacional HapMap permite el estudio de la LD en poblaciones humanas en línea . El proyecto Ensembl integra los datos de HapMap con otra información genética de dbSNP .
Software de análisis
- PLINK : conjunto de herramientas de análisis de asociación del genoma completo, que puede calcular LD, entre otras cosas
- LDHat
- Haploview
- LdCompare [20] : software de código abierto para calcular LD.
- SNP y Variation Suite : software comercial con gráfico LD interactivo.
- ORO : descripción gráfica del desequilibrio de ligamiento
- TASSEL : software para evaluar el desequilibrio de ligamiento, asociaciones de rasgos y patrones evolutivos
- rAggr : encuentra marcadores proxy (SNP e indels) que están en desequilibrio de ligamiento con un conjunto de marcadores consultados, utilizando las bases de datos de genotipos 1000 Genomes Project y HapMap .
- SNeP : cálculo rápido de LD y Ne para grandes conjuntos de datos de genotipos en formato PLINK.
- LDlink : un conjunto de aplicaciones basadas en web para explorar de manera fácil y eficiente el desequilibrio de vínculos en subgrupos de población. Todos los datos del genotipo de la población se originan en la Fase 3 del Proyecto 1000 Genomas y los números de RS variantes se indexan según el dbSNP build 151.
Software de simulación
- Haploide : una biblioteca C para la simulación genética de poblaciones ( GPL )
Ver también
- Haploview
- Principio de Hardy-Weinberg
- Ligamiento genético
- Coadaptación
- Prueba de ADN genealógica
- Etiqueta SNP
- Mapeo de asociaciones
- Mapeo QTL basado en la familia
Referencias
- ↑ a b c Slatkin, Montgomery (junio de 2008). "Desequilibrio de vinculación - comprensión del pasado evolutivo y mapeo del futuro médico" . Nature Reviews Genética . 9 (6): 477–485. doi : 10.1038 / nrg2361 . PMC 5124487 . PMID 18427557 .
- ^ Falconer, DS; Mackay, TFC (1996). Introducción a la genética cuantitativa (4ª ed.). Harlow, Essex, Reino Unido: Addison Wesley Longman. ISBN 978-0-582-24302-6.
- ^ Slatkin, Montgomery (junio de 2008). "Desequilibrio de vinculación - comprensión del pasado evolutivo y mapeo del futuro médico" . Nature Reviews Genética . 9 (6): 477–485. doi : 10.1038 / nrg2361 . ISSN 1471-0056 . PMC 5124487 . PMID 18427557 .
- ^ Calabrese, Barbara (1 de enero de 2019), Ranganathan, Shoba; Gribskov, Michael; Nakai, Kenta; Schönbach, Christian (eds.), "Linkage Desequilibrium" , Enciclopedia de bioinformática y biología computacional , Oxford: Academic Press, págs. 763–765, doi : 10.1016 / b978-0-12-809633-8.20234-3 , ISBN 978-0-12-811432-2, consultado el 21 de octubre de 2020
- ^ Lewontin, RC (1964). "La interacción de la selección y el encadenamiento. I. Consideraciones generales; modelos heteróticos" . Genética . 49 (1): 49–67. PMC 1210557 . PMID 17248194 .
- ^ Robbins, RB (1 de julio de 1918). "Algunas aplicaciones de las matemáticas a los problemas de cría III" . Genética . 3 (4): 375–389. PMC 1200443 . PMID 17245911 .
- ^ RC Lewontin y K. Kojima (1960). "La dinámica evolutiva de polimorfismos complejos". Evolución . 14 (4): 458–472. doi : 10.2307 / 2405995 . ISSN 0014-3820 . JSTOR 2405995 .
- ↑ a b Svejgaard A, Hauge M, Jersild C, Plaz P, Ryder LP, Staub Nielsen L, Thomsen M (1979). El sistema HLA: una encuesta introductoria, 2ª ed. Basilea; Londres; Chichester: Karger; Distribuida por Wiley, ISBN 3805530498 (pbk).
- ↑ a b c d Vogel F, Motulsky AG (1997). Genética humana: problemas y enfoques, 3ª ed. Berlina; Londres: Springer, ISBN 3-540-60290-9 .
- ^ Mittal KK, Hasegawa T, Ting A, Mickey MR, Terasaki PI (1973). "Variación genética en el sistema HL-A entre Ainus, japoneses y caucásicos", en Dausset J, Colombani J, eds. Pruebas de histocompatibilidad , 1972, págs. 187-195, Copenhague: Munksgaard, ISBN 87-16-01101-5 .
- ^ Yasuda, N; Tsuji, K (junio de 1975). "Un método de conteo de máxima probabilidad para estimar la frecuencia de haplotipos en el sistema HL-A". Jinrui Idengaku Zasshi . 20 (1): 1-15. PMID 1237691 .
- ^ a b c d Mittal, KK (1976). "El polimorfismo HLA y la susceptibilidad a la enfermedad". Vox Sang . 31? -73 (3): 161–73. doi : 10.1111 / j.1423-0410.1976.tb02206.x . PMID 969389 .
- ↑ a b c Gregersen PK (2009). "Genética de las enfermedades reumáticas", en Firestein GS, Budd RC, Harris ED Jr, McInnes IB, Ruddy S, Sergent JS, eds. (2009). Kelley's Textbook of Rheumatology, págs.305-321, Filadelfia, PA: Saunders / Elsevier, ISBN 978-1-4160-3285-4 .
- ^ a b c Bengtsson, BO; Thomson, G (noviembre de 1981). "Medir la fuerza de las asociaciones entre los antígenos HLA y las enfermedades". Antígenos tisulares . 18 (5): 356–63. doi : 10.1111 / j.1399-0039.1981.tb01404.x . PMID 7344182 .
- ^ a b Nijenhuis, LE (septiembre de 1977). "Consideraciones genéticas sobre la asociación entre HLA y enfermedad". Tararear. Genet . 38 (2): 175–82. doi : 10.1007 / bf00527400 . PMID 908564 .
- ^ Woolf, B (junio de 1955). "Sobre la estimación de la relación entre grupo sanguíneo y enfermedad". Ana. Tararear. Genet . 19 (4): 251–3. doi : 10.1111 / j.1469-1809.1955.tb01348.x . PMID 14388528 .
- ^ Haldane, JB (mayo de 1956). "La estimación y significado del logaritmo de una razón de frecuencias". Ana. Tararear. Genet . 20 (4): 309-11. doi : 10.1111 / j.1469-1809.1955.tb01285.x . PMID 13314400 .
- ^ Sokal RR, Rohlf FJ (1981). Biometría: los principios y la práctica de la estadística en la investigación biológica. Oxford: WH Freeman, ISBN 0-7167-1254-7 .
- ^ Devlin B .; Risch N. (1995). "Una comparación de medidas de desequilibrio de vinculación para el mapeo a escala fina" (PDF) . Genómica . 29 (2): 311–322. CiteSeerX 10.1.1.319.9349 . doi : 10.1006 / geno.1995.9003 . PMID 8666377 .
- ^ Hao K .; Di X .; Cawley S. (2007). "LdCompare: cálculo rápido de cobertura genética y r2 de marcador único y múltiple" . Bioinformática . 23 (2): 252-254. doi : 10.1093 / bioinformatics / btl574 . PMID 17148510 .
Otras lecturas
- Hedrick, Philip W. (2005). Genética de Poblaciones (3ª ed.). Sudbury, Boston, Toronto, Londres, Singapur: Jones and Bartlett Publishers. ISBN 978-0-7637-4772-5.
- Bibliografía: Análisis de desequilibrio de ligamiento : una bibliografía de más de mil artículos sobre desequilibrio de ligamiento publicados desde 1918.