F- estadísticas

En genética de poblaciones , las estadísticas F (también conocidas como índices de fijación ) describen el nivel estadísticamente esperado de heterocigosidad en una población; más específicamente, el grado esperado de (generalmente) una reducción en la heterocigosidad en comparación con la expectativa de Hardy-Weinberg .

Las estadísticas F también se pueden considerar como una medida de la correlación entre genes extraídos en diferentes niveles de una población subdividida (jerárquicamente). Esta correlación está influenciada por varios procesos evolutivos , como la deriva genética , el efecto fundador , el cuello de botella , el autostop genético , el impulso meiótico , la mutación , el flujo genético , la endogamia , la selección natural o el efecto Wahlund , pero originalmente fue diseñado para medir la cantidad de fijación alélica debido a la deriva genética .

El concepto de estadística F fue desarrollado durante la década de 1920 por el genetista estadounidense Sewall Wright , ^[1]^[2] que estaba interesado en la endogamia en el ganado . Sin embargo, debido a que la dominancia completa hace que los fenotipos de homocigotos dominantes y heterocigotos sean los mismos, no fue hasta el advenimiento de la genética molecular a partir de la década de 1960 que se pudo medir la heterocigosidad en las poblaciones.

F se puede utilizar para definir el tamaño efectivo de la población . ^{[ se necesita más explicación ]}

Definiciones y ecuaciones

Las medidas F _IS , F _ST y F _IT están relacionadas con las cantidades de heterocigosidad en varios niveles de la estructura de la población. Juntos, se denominan estadísticas F y se derivan de F , el coeficiente de consanguinidad . En un sistema simple de dos alelos con endogamia, las frecuencias genotípicas son:

{\ Displaystyle p ^ {2} (1-F) + pF {\ text {para}} \ mathbf {AA}; \ 2pq (1-F) {\ text {para}} \ mathbf {Aa}; {\ texto {y}} q ^ {2} (1-F) + qF {\ text {para}} \ mathbf {aa}.}

El valor de F se encuentra resolviendo la ecuación de F utilizando heterocigotos en la población consanguínea anterior. Esto se convierte en uno menos la frecuencia observada de heterocigotos en una población dividida por la frecuencia esperada de heterocigotos en el equilibrio de Hardy-Weinberg :

{\ Displaystyle F = 1 - {\ frac {\ operatorname {O} (f (\ mathbf {Aa}))} {\ operatorname {E} (f (\ mathbf {Aa}))}} = 1 - {\ frac {\ operatorname {ObservedFrequency} (\ mathbf {Aa})} {\ operatorname {ExpectedFrequency} (\ mathbf {Aa})}}, \!}

donde la frecuencia esperada en el equilibrio de Hardy-Weinberg está dada por

{\ Displaystyle \ operatorname {E} (f (\ mathbf {Aa})) = 2pq, \!}

donde p y q son las frecuencias de los alelos de A y una , respectivamente. También es la probabilidad de que en cualquier locus , dos alelos de un individuo aleatorio de la población sean idénticos por descendencia .

Por ejemplo, considere los datos de EB Ford (1971) sobre una sola población de polilla tigre escarlata :

**Tabla 1:**
Genotipo	Manchas blancas ( AA )	Intermedio ( Aa )	Pequeñas manchas ( aa )	Total
Número	1469	138	5	1612

A partir de esto, se pueden calcular las frecuencias alélicas y derivar la expectativa de ƒ (Aa):

{\ Displaystyle p = {2 \ times \ mathrm {obs} (AA) + \ mathrm {obs} (Aa) \ over 2 \ times (\ mathrm {obs} (AA) + \ mathrm {obs} (Aa) + \ mathrm {obs} (aa))} = 0.954}

{\ Displaystyle q = 1-p = 0.046 \,}

{\ displaystyle F = 1 - {\ frac {\ mathrm {obs} (Aa) / n} {2pq}} = 1- {138/1612 \ over 2 (0,954) (0,046)} = 0,023}

Las diferentes estadísticas F analizan diferentes niveles de estructura de la población. F _IT es el coeficiente de consanguinidad de un individuo ( I ) en relación con la población total ( T ), como se indicó anteriormente; F _IS es el coeficiente de consanguinidad de un individuo ( I ) en relación con la subpoblación ( S ), utilizando lo anterior para las subpoblaciones y promediandolas; y F _ST es el efecto de las subpoblaciones ( S ) en comparación con la población total ( T ), y se calcula resolviendo la ecuación:

{\ Displaystyle (1-F_ {IS}) (1-F_ {ST}) = 1-F_ {IT}, \,}

como se muestra en la siguiente sección.

Partición debido a la estructura de la población

F _IT se puede dividir en F _ST debido al efecto Wahlund y F _IS debido a la endogamia .

Considere una población que tiene una estructura poblacional de dos niveles; uno del individuo (I) a la subpoblación (S) y uno de la subpoblación al total (T). Entonces la F total , conocida aquí como F _IT , se puede dividir en F _IS ( of ) y F _ST (o θ ):

{\ Displaystyle 1-F_ {IT} = (1-F_ {IS}) \, (1-F_ {ST}). \!}

Esto puede dividirse aún más para la subestructura de la población, y se expande de acuerdo con las reglas de expansión binomial , de modo que para I particiones:

{\ Displaystyle 1-F = \ prod _ {i = 0} ^ {i = I} (1-F_ {i, i + 1}) \!}

Índice de fijación

Una reformulación de la definición de F sería la proporción del número promedio de diferencias entre pares de cromosomas muestreados dentro de los individuos diploides con el número promedio obtenido al muestrear cromosomas al azar de la población (excluyendo el agrupamiento por individuo). Se puede modificar esta definición y considerar una agrupación por subpoblación en lugar de por individuo. Los genetistas de poblaciones han utilizado esa idea para medir el grado de estructura de una población.

Desafortunadamente, existe una gran cantidad de definiciones para F _ST , lo que genera cierta confusión en la literatura científica. Una definición común es la siguiente:

{\ Displaystyle F_ {ST} = {\ frac {\ operatorname {var} (\ mathbf {p})} {p \, (1-p)}} \!}

donde la varianza de p se calcula entre subpoblaciones yp (1− p ) es la frecuencia esperada de heterocigotos.

Índice de fijación en poblaciones humanas

Está bien establecido que la diversidad genética entre las poblaciones humanas es baja, ^[3] aunque la distribución de la diversidad genética sólo se estimó de forma aproximada. Los primeros estudios argumentaron que el 85-90% de la variación genética se encuentra dentro de individuos que residen en las mismas poblaciones dentro de continentes (poblaciones intracontinentales) y solo un 10-15% adicional se encuentra entre poblaciones de diferentes continentes (poblaciones continentales). ^[4]^[5]^[6]^[7]^[8] Estudios posteriores basados en cientos de miles de polimorfismos de un solo nucleótido (SNP) sugirieron que la diversidad genética entre las poblaciones continentales es aún menor y representa del 3 al 7% ^[9]^[10]^[11]^[12]^[13]^[14] Un estudio posterior basado en tres millones de SNP encontró que el 12% de la variación genética se encuentra entre poblaciones continentales y solo el 1% dentro de ellas. ^[15] La mayoría de estos estudios han utilizado las estadísticas F ST^[16] o estadísticas estrechamente relacionadas. ^[17]^[18]

Ver también

Método de coancestría de Malecot
Heterocigosidad
Índice de fijación

Referencias

^ Wright, S (1950). "Estructura genética de poblaciones". Naturaleza . 166 (4215): 247–9. Código Bibliográfico : 1950Natur.166..247W . doi : 10.1038 / 166247a0 . PMID 15439261 .
^ Kulig, K (1985). "Utilización de pantallas de toxicología de emergencia". The American Journal of Emergency Medicine . 3 (6): 573–4. doi : 10.1016 / 0735-6757 (85) 90177-9 . LCCN 67025533 . PMID 4063030 .
^ Holsinger, Kent E .; Weir, Bruce S. (2009). "Genética en poblaciones estructuradas geográficamente: Definición, estimación e interpretación de FST" . Nature Reviews Genética . 10 (9): 639–50. doi : 10.1038 / nrg2611 . PMC 4687486 . PMID 19687804 .
^ Lewontin (1972). "La distribución de la diversidad humana". Biología evolutiva . 6 : 381–98. doi : 10.1007 / 978-1-4684-9063-3_14 . ISBN 978-1-4684-9065-7.
^ Bowcock, Anne M .; Kidd, Judith R .; Montaña, Joanna L .; Herbert, Joan M .; Carotenuto, Luciano; Kidd, Kenneth K .; Cavalli-Sforza, Luca (1991). "Deriva, mezcla y selección en la evolución humana: un estudio con polimorfismos de ADN" . Actas de la Academia Nacional de Ciencias . 88 (3): 839–43. Código Bibliográfico : 1991PNAS ... 88..839B . doi : 10.1073 / pnas.88.3.839 . JSTOR 2356081 . PMC 50909 . PMID 1992475 .
^ Barbujani, Guido; Magagni, Arianna; Minch, Eric; Cavalli-Sforza, L. Luca (1997). "Una distribución de la diversidad del ADN humano" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 94 (9): 4516–9. Código Bibliográfico : 1997PNAS ... 94.4516B . doi : 10.1073 / pnas.94.9.4516 . JSTOR 42042 . PMC 20754 . PMID 9114021 .
^ Jorde, LB; Watkins, WS; Bamshad, MJ; Dixon, ME; Ricker, CE; Seielstad, MT; Batzer, MA (2000). "La distribución de la diversidad genética humana: una comparación de datos del cromosoma Y, autosómico y mitocondrial" . La Revista Estadounidense de Genética Humana . 66 (3): 979–88. doi : 10.1086 / 302825 . PMC 1288178 . PMID 10712212 .
^ Jorde, Lynn B; Wooding, Stephen P (2004). "Variación genética, clasificación y 'raza ' " . Genética de la naturaleza . 36 (11s): S28-33. doi : 10.1038 / ng1435 . PMID 15508000 .
^ Mahasirimongkol, Surakameth; Chantratita, Wasun; Promso, Somying; Pasomsab, Ekawat; et al. (2006). "Similitud de la frecuencia de alelos y patrón de desequilibrio de ligamiento de polimorfismos de un solo nucleótido en loci de genes relacionados con drogas entre poblaciones tailandesas y del norte de Asia oriental: implicaciones para marcar la selección de SNP en tailandeses" . Revista de Genética Humana . 51 (10): 896–904. doi : 10.1007 / s10038-006-0041-1 . PMID 16957813 .
^ Hannelius, Ulf; Salmela, Elina; Lappalainen, Tuuli; Guillot, Gilles; Lindgren, Cecilia M; Von Döbeln, Ulrika; Lahermo, Päivi; Kere, Juha (2008). "Subestructura de la población en Finlandia y Suecia revelada por el uso de coordenadas espaciales y un pequeño número de SNP autosómicos no vinculados" . BMC Genetics . 9 : 54. doi : 10.1186 / 1471-2156-9-54 . PMC 2527025 . PMID 18713460 .
^ Lao, Oscar; Lu, Timothy T .; Nothnagel, Michael; Junge, Olaf; et al. (2008). "Correlación entre estructura genética y geográfica en Europa". Biología actual . 18 (16): 1241–8. doi : 10.1016 / j.cub.2008.07.049 . PMID 18691889 .
^ Biswas, Shameek; Scheinfeldt, Laura B .; Akey, Joshua M. (2009). "Conocimientos de todo el genoma sobre los patrones y determinantes de la estructura de la población a escala fina en los seres humanos" . La Revista Estadounidense de Genética Humana . 84 (5): 641–650. doi : 10.1016 / j.ajhg.2009.04.015 . PMC 2681007 . PMID 19442770 .
^ Nelis, Mari; Esko, Tõnu; Mägi, Reedik; Zimprich, Fritz; et al. (2009). Fleischer, Robert C (ed.). "Estructura genética de los europeos: una vista desde el noreste" . PLOS ONE . 4 (5): e5472. Código bibliográfico : 2009PLoSO ... 4.5472N . doi : 10.1371 / journal.pone.0005472 . PMC 2675054 . PMID 19424496 .
^ Reich, David; Thangaraj, Kumarasamy; Patterson, Nick; Price, Alkes L .; et al. (2009). "Reconstrucción de la historia de la población india" . Naturaleza . 461 (7263): 489–94. Código Bibliográfico : 2009Natur.461..489R . doi : 10.1038 / nature08365 . PMC 2842210 . PMID 19779445 .
^ Elhaik, E (2012). "Distribuciones empíricas de FST a partir de datos de polimorfismo humano a gran escala" . PLOS ONE . 7 (11): e49837. Código bibliográfico : 2012PLoSO ... 749837E . doi : 10.1371 / journal.pone.0049837 . PMC 3504095 . PMID 23185452 .
^ Wright, Sewall (1965). "La interpretación de la estructura de la población por F-Estadística con especial atención a los sistemas de apareamiento". Evolución . 19 (3): 395–420. doi : 10.2307 / 2406450 . JSTOR 2406450 .
^ Shalev, BA; Dvorin, A .; Herman, R .; Katz, Z .; Bornstein, S. (1991). "Cría de ganso a largo plazo para la producción de huevos y el peso del hígado hacinado". Ciencia avícola británica . 32 (4): 703–9. doi : 10.1080 / 00071669108417396 . PMID 1933444 .
^ Excoffier, L; Smouse, PE; Quattro, JM (1992). "Análisis de varianza molecular inferida de distancias métricas entre haplotipos de ADN: aplicación a datos de restricción de ADN mitocondrial humano" . Genética . 131 (2): 479–91. PMC 1205020 . PMID 1644282 .

enlaces externos

Guía simple de Shane para estadísticas F
Analizando la estructura genética de poblaciones
Efecto Wahlund, estadísticas F de Wright
Ejemplo resuelto de cálculo de estadísticas F a partir de datos genotípicos
Estadísticas F basadas en IAM
Estadísticas F para la herramienta ecológica de genética de poblaciones
Estructura de la población (diapositivas)

[1] Wright, S (1950). "Estructura genética de poblaciones". Naturaleza . 166 (4215): 247–9. Código Bibliográfico : 1950Natur.166..247W . doi : 10.1038 / 166247a0 . PMID 15439261 .

[2] Kulig, K (1985). "Utilización de pantallas de toxicología de emergencia". The American Journal of Emergency Medicine . 3 (6): 573–4. doi : 10.1016 / 0735-6757 (85) 90177-9 . LCCN 67025533 . PMID 4063030 .

[3] Holsinger, Kent E .; Weir, Bruce S. (2009). "Genética en poblaciones estructuradas geográficamente: Definición, estimación e interpretación de FST" . Nature Reviews Genética . 10 (9): 639–50. doi : 10.1038 / nrg2611 . PMC 4687486 . PMID 19687804 .

[4] Lewontin (1972). "La distribución de la diversidad humana". Biología evolutiva . 6 : 381–98. doi : 10.1007 / 978-1-4684-9063-3_14 . ISBN 978-1-4684-9065-7.

[5] Bowcock, Anne M .; Kidd, Judith R .; Montaña, Joanna L .; Herbert, Joan M .; Carotenuto, Luciano; Kidd, Kenneth K .; Cavalli-Sforza, Luca (1991). "Deriva, mezcla y selección en la evolución humana: un estudio con polimorfismos de ADN" . Actas de la Academia Nacional de Ciencias . 88 (3): 839–43. Código Bibliográfico : 1991PNAS ... 88..839B . doi : 10.1073 / pnas.88.3.839 . JSTOR 2356081 . PMC 50909 . PMID 1992475 .

[6] Barbujani, Guido; Magagni, Arianna; Minch, Eric; Cavalli-Sforza, L. Luca (1997). "Una distribución de la diversidad del ADN humano" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 94 (9): 4516–9. Código Bibliográfico : 1997PNAS ... 94.4516B . doi : 10.1073 / pnas.94.9.4516 . JSTOR 42042 . PMC 20754 . PMID 9114021 .

[7] Jorde, LB; Watkins, WS; Bamshad, MJ; Dixon, ME; Ricker, CE; Seielstad, MT; Batzer, MA (2000). "La distribución de la diversidad genética humana: una comparación de datos del cromosoma Y, autosómico y mitocondrial" . La Revista Estadounidense de Genética Humana . 66 (3): 979–88. doi : 10.1086 / 302825 . PMC 1288178 . PMID 10712212 .

[8] Jorde, Lynn B; Wooding, Stephen P (2004). "Variación genética, clasificación y 'raza ' " . Genética de la naturaleza . 36 (11s): S28-33. doi : 10.1038 / ng1435 . PMID 15508000 .

[9] Mahasirimongkol, Surakameth; Chantratita, Wasun; Promso, Somying; Pasomsab, Ekawat; et al. (2006). "Similitud de la frecuencia de alelos y patrón de desequilibrio de ligamiento de polimorfismos de un solo nucleótido en loci de genes relacionados con drogas entre poblaciones tailandesas y del norte de Asia oriental: implicaciones para marcar la selección de SNP en tailandeses" . Revista de Genética Humana . 51 (10): 896–904. doi : 10.1007 / s10038-006-0041-1 . PMID 16957813 .

[10] Hannelius, Ulf; Salmela, Elina; Lappalainen, Tuuli; Guillot, Gilles; Lindgren, Cecilia M; Von Döbeln, Ulrika; Lahermo, Päivi; Kere, Juha (2008). "Subestructura de la población en Finlandia y Suecia revelada por el uso de coordenadas espaciales y un pequeño número de SNP autosómicos no vinculados" . BMC Genetics . 9 : 54. doi : 10.1186 / 1471-2156-9-54 . PMC 2527025 . PMID 18713460 .

[11] Lao, Oscar; Lu, Timothy T .; Nothnagel, Michael; Junge, Olaf; et al. (2008). "Correlación entre estructura genética y geográfica en Europa". Biología actual . 18 (16): 1241–8. doi : 10.1016 / j.cub.2008.07.049 . PMID 18691889 .

[12] Biswas, Shameek; Scheinfeldt, Laura B .; Akey, Joshua M. (2009). "Conocimientos de todo el genoma sobre los patrones y determinantes de la estructura de la población a escala fina en los seres humanos" . La Revista Estadounidense de Genética Humana . 84 (5): 641–650. doi : 10.1016 / j.ajhg.2009.04.015 . PMC 2681007 . PMID 19442770 .

[13] Nelis, Mari; Esko, Tõnu; Mägi, Reedik; Zimprich, Fritz; et al. (2009). Fleischer, Robert C (ed.). "Estructura genética de los europeos: una vista desde el noreste" . PLOS ONE . 4 (5): e5472. Código bibliográfico : 2009PLoSO ... 4.5472N . doi : 10.1371 / journal.pone.0005472 . PMC 2675054 . PMID 19424496 .

[14] Reich, David; Thangaraj, Kumarasamy; Patterson, Nick; Price, Alkes L .; et al. (2009). "Reconstrucción de la historia de la población india" . Naturaleza . 461 (7263): 489–94. Código Bibliográfico : 2009Natur.461..489R . doi : 10.1038 / nature08365 . PMC 2842210 . PMID 19779445 .

[15] Elhaik, E (2012). "Distribuciones empíricas de FST a partir de datos de polimorfismo humano a gran escala" . PLOS ONE . 7 (11): e49837. Código bibliográfico : 2012PLoSO ... 749837E . doi : 10.1371 / journal.pone.0049837 . PMC 3504095 . PMID 23185452 .

[16] Wright, Sewall (1965). "La interpretación de la estructura de la población por F-Estadística con especial atención a los sistemas de apareamiento". Evolución . 19 (3): 395–420. doi : 10.2307 / 2406450 . JSTOR 2406450 .

[17] Shalev, BA; Dvorin, A .; Herman, R .; Katz, Z .; Bornstein, S. (1991). "Cría de ganso a largo plazo para la producción de huevos y el peso del hígado hacinado". Ciencia avícola británica . 32 (4): 703–9. doi : 10.1080 / 00071669108417396 . PMID 1933444 .

[18] Excoffier, L; Smouse, PE; Quattro, JM (1992). "Análisis de varianza molecular inferida de distancias métricas entre haplotipos de ADN: aplicación a datos de restricción de ADN mitocondrial humano" . Genética . 131 (2): 479–91. PMC 1205020 . PMID 1644282 .

[1]