En genética de poblaciones , el espectro de frecuencias alélicas , a veces llamado espectro de frecuencias del sitio , es la distribución de las frecuencias alélicas de un conjunto dado de loci (a menudo SNP ) en una población o muestra. [1] [2] [3] [4] Debido a que un espectro de frecuencias de alelos a menudo es un resumen o se compara con muestras secuenciadas de toda la población, es un histograma cuyo tamaño depende del número de cromosomas individuales secuenciados. Cada entrada en el espectro de frecuencias registra el número total de loci con el correspondiente derivadofrecuencia alélica. Se supone que los loci que contribuyen al espectro de frecuencias cambian independientemente en frecuencia. Además, se supone que los loci son bialélicos (es decir, con exactamente dos alelos presentes), aunque existen extensiones para espectros de frecuencias multialélicas. [5]
Muchas estadísticas resumidas de la variación genética observada son en sí mismas resúmenes del espectro de frecuencias alélicas, incluidas estimaciones decomo el de Watterson y Tajima's , De Tajima D , Fay y H de Wu y. [6]
Ejemplo
El espectro de frecuencias alélicas de una muestra de los cromosomas se calcula contando el número de sitios con frecuencias alélicas derivadas . Por ejemplo, considere una muestra deindividuos con ocho sitios variables observados. En esta tabla, un 1 indica que el alelo derivado se observa en ese sitio, mientras que un 0 indica que se observó el alelo ancestral.
SNP 1 | SNP 2 | SNP 3 | SNP 4 | SNP 5 | SNP 6 | SNP 7 | SNP 8 | |
---|---|---|---|---|---|---|---|---|
Muestra 1 | 0 | 1 | 0 | 0 | 0 | 0 | 1 | 0 |
Muestra 2 | 1 | 0 | 1 | 0 | 0 | 0 | 1 | 0 |
Muestra 3 | 0 | 1 | 1 | 0 | 0 | 1 | 0 | 0 |
Muestra 4 | 0 | 0 | 0 | 0 | 1 | 0 | 1 | 1 |
Muestra 5 | 0 | 0 | 1 | 0 | 0 | 0 | 1 | 0 |
Muestra 6 | 0 | 0 | 0 | 1 | 0 | 1 | 1 | 0 |
Total | 1 | 2 | 3 | 1 | 1 | 2 | 5 | 1 |
El espectro de frecuencias alélicas se puede escribir como el vector , dónde es el número de sitios observados con frecuencia alélica derivada . En este ejemplo, el espectro de frecuencia del alelo observado es, debido a cuatro instancias de un único alelo derivado observado en un loci de SNP particular, dos instancias de dos alelos derivados, y así sucesivamente.
Cálculo
El espectro de frecuencia de alelos esperado se puede calcular utilizando un enfoque de coalescencia o difusión . [7] [8] La historia demográfica de una población y la selección natural afectan la dinámica de la frecuencia de los alelos, y estos efectos se reflejan en la forma del espectro de frecuencias de los alelos. Para el caso simple de la segregación de alelos neutros selectivos en una población que ha alcanzado el equilibrio demográfico (es decir, sin cambios recientes en el tamaño de la población o sin flujo de genes), el espectro de frecuencias del alelo esperado para una muestra de tamaño es dado por
dónde es la tasa de mutación escalada de la población. Las desviaciones del equilibrio demográfico o la neutralidad cambiarán la forma del espectro de frecuencias esperado.
El cálculo del espectro de frecuencias a partir de los datos de la secuencia observada requiere que uno sea capaz de distinguir los alelos ancestrales y derivados (mutantes), a menudo comparándolos con una secuencia exógena . Por ejemplo, en estudios genéticos de poblaciones humanas, la secuencia de referencia de chimpancé homóloga se usa típicamente para estimar el alelo ancestral. Sin embargo, a veces no se puede determinar el alelo ancestral, en cuyo caso se puede calcular el espectro de frecuencia del alelo plegado. El espectro de frecuencias plegado almacena los recuentos observados de las frecuencias alélicas menores (las más raras). El espectro plegado se puede calcular agrupando losth y th entradas del espectro desplegado, donde es el número de individuos muestreados.
Espectro de frecuencia de alelos de múltiples poblaciones
El espectro de frecuencias alélicas conjuntas (JAFS) es la distribución conjunta de frecuencias alélicas en dos o más poblaciones relacionadas. El JAFS para poblaciones, con cromosomas muestreados en el a población, es una -histograma dimensional, en el que cada entrada almacena el número total de sitios segregantes en los que se observa el alelo derivado con la frecuencia correspondiente en cada población. Cada eje del histograma corresponde a una población y los índices se ejecutan desde Para el a población. [9] [10]
Ejemplo
Supongamos que secuenciamos individuos diploides de dos poblaciones, 4 individuos de la población 1 y 2 individuos de la población 2. El JAFS sería un matriz, indexada desde cero. La La entrada registraría el número de loci polimórficos observados con frecuencia alélica derivada 3 en la población 1 y frecuencia 2 en la población 2. La La entrada registraría aquellos loci con frecuencia observada 1 en la población 1 y frecuencia 0 en la población 2. La La entrada registraría aquellos loci con el alelo derivado fijado en la población 1 (visto en todos los cromosomas), y con frecuencia 3 en la población 2.
Aplicaciones
La forma del espectro de frecuencias alélicas es sensible a la demografía, como los cambios en el tamaño de la población, la migración y la subestructura, así como la selección natural. Al comparar los datos observados resumidos en un espectro de frecuencia con el espectro de frecuencia esperado calculado bajo un modelo demográfico y de selección dado, se puede evaluar la bondad de ajuste del modelo a los datos, y usar la teoría de verosimilitud para estimar los parámetros de mejor ajuste del modelo. modelo.
Por ejemplo, suponga que una población experimentó un período reciente de crecimiento exponencial y Se obtuvieron secuencias de muestra de la población al final del crecimiento y se calculó el espectro de frecuencias alélicas observado (datos) utilizando una variación supuestamente neutra. El modelo demográfico tendría parámetros para la tasa de crecimiento exponencial, el tiempo para el que se produjo el crecimiento, y un tamaño de población de referencia , asumiendo que la población estaba en equilibrio cuando comenzó el crecimiento. El espectro de frecuencia esperado para un conjunto de parámetros dadopuede obtenerse utilizando la teoría de la difusión o la coalescente, y compararse con el espectro de frecuencias de datos. Los parámetros de mejor ajuste se pueden encontrar utilizando la máxima verosimilitud.
Este enfoque se ha utilizado para inferir modelos demográficos y de selección para muchas especies, incluidos los humanos. Por ejemplo, Marth et al. (2004) utilizaron los espectros de frecuencia de alelos de una sola población para un grupo de africanos, europeos y asiáticos para mostrar que se han producido cuellos de botella en la población en las historias demográficas de Asia y Europa, pero no en las africanas. [11] Más recientemente, Gutenkunst et al. (2009) utilizaron el espectro de frecuencias de alelos conjuntos para estas mismas tres poblaciones para inferir el momento en el que las poblaciones divergieron y la cantidad de migración subsiguiente en curso entre ellas (ver la hipótesis de fuera de África ). [10] Además, estos métodos pueden usarse para estimar patrones de selección a partir de datos de frecuencia de alelos. Por ejemplo, Boyko et al. (2008) infirieron la distribución de los efectos de aptitud para mutaciones de reciente aparición utilizando datos de polimorfismo humano que controlaron los efectos de la demografía en desequilibrio. [12]
Referencias
- ^ Fisher, Ronald A. (1930). "La distribución de las proporciones de genes para mutaciones raras". Actas de la Royal Society of Edinburgh . 50 : 205–220.
- ^ Wright, Sewall (1938). "La distribución de frecuencias de genes bajo mutación irreversible" . Proc. Natl. Acad. Sci. USA . 24 : 253-259. Código Bibliográfico : 1938PNAS ... 24..253W . doi : 10.1073 / pnas.24.7.253 . PMC 1077089 . PMID 16577841 .
- ^ Kimura, Motoo (1964). "Modelos de difusión en genética de poblaciones". J. Appl. Probab . 1 (2): 177–232. doi : 10.2307 / 3211856 .
- ^ Evans, Steven N .; Shvets, Yelena; Slatkin, Montgomery (2007). "Teoría del no equilibrio del espectro de frecuencias alélicas". Biología teórica de poblaciones . 71 (1): 109-119. arXiv : q-bio / 0604010 . doi : 10.1016 / j.tpb.2006.06.005 .
- ^ Jenkins, Paul A .; Mueller, Jonas W .; Canción, Yun S. (2014). "Espectro de frecuencias trialélicas generales bajo modelos demográficos con tamaño de población variable" . Genética . 196 (1): 295–311. arXiv : 1310.3444 . doi : 10.1534 / genetics.113.158584 . PMC 3872192 . PMID 24214345 .
- ^ Durrett, Rick (2008). Modelos de probabilidad para la evolución de la secuencia de ADN (PDF) (2 ed.).
- ^ Wakeley, John. Teoría coalescente: una introducción . Editores de Roberts & Company. ISBN 0974707759.
- ^ Cuervo, James F .; Kimura, Motoo (1970). Una introducción a la teoría de la genética de poblaciones ([Reimpresión] ed.). Nueva Jersey: Blackburn Press. ISBN 9781932846126.
- ^ Chen, H .; Verde, RE; Paabo, S .; Slatkin, M. (29 de julio de 2007). "El espectro conjunto de frecuencias alelo en especies estrechamente relacionadas" . Genética . 177 (1): 387–398. doi : 10.1534 / genetics.107.070730 . PMC 2013700 . PMID 17603120 .
- ^ a b Gutenkunst, Ryan N .; Hernández, Ryan D .; Williamson, Scott H .; Bustamante, Carlos D. (23 de octubre de 2009). "Inferir la historia demográfica conjunta de múltiples poblaciones a partir de datos de frecuencia SNP multidimensionales" . PLoS Genetics . 5 (10): e1000695. doi : 10.1371 / journal.pgen.1000695 . PMC 2760211 . PMID 19851460 .
- ^ Marth, Gabor T .; Czabarka, Eva; Murvai, Janos; Sherry, Stephen T. (1 de enero de 2004). "El espectro de frecuencias alélicas en datos de variación humana en todo el genoma revela señales de la historia demográfica diferencial en tres grandes poblaciones mundiales" . Genética . 166 (1): 351–372. doi : 10.1534 / genetics.166.1.351 . PMC 1470693 . PMID 15020430 .
- ^ Boyko, Adam R .; Williamson, Scott H .; Indap, Amit R .; Degenhardt, Jeremiah D .; Hernández, Ryan D .; Lohmueller, Kirk E .; Adams, Mark D .; Schmidt, Steffen; Sninsky, John J .; Sunyaev, Shamil R .; White, Thomas J .; Nielsen, Rasmus; Clark, Andrew G .; Bustamante, Carlos D. (30 de mayo de 2008). "Evaluación del impacto evolutivo de las mutaciones de aminoácidos en el genoma humano" . PLoS Genetics . 4 (5): e1000083. doi : 10.1371 / journal.pgen.1000083 .