En genómica , un estudio de asociación de todo el genoma ( estudio de GWA o GWAS ), también conocido como estudio de asociación de genoma completo ( estudio de WGA o WGAS ), es un estudio observacional de un conjunto de variantes genéticas de todo el genoma en diferentes individuos para ver si alguna variante está asociada con un rasgo. Los estudios de GWA generalmente se enfocan en asociaciones entre polimorfismos de un solo nucleótido (SNP) y rasgos como las principales enfermedades humanas, pero también se pueden aplicar a cualquier otra variante genética y cualquier otro organismo.
Cuando se aplican a datos humanos, los estudios de GWA comparan el ADN de los participantes que tienen diferentes fenotipos para un rasgo o enfermedad en particular. Estos participantes pueden ser personas con una enfermedad (casos) y personas similares sin la enfermedad (controles), o pueden ser personas con diferentes fenotipos para un rasgo en particular, por ejemplo, presión arterial. Este enfoque se conoce como fenotipo primero, en el que los participantes se clasifican primero por sus manifestaciones clínicas, en contraposición al genotipo primero . Cada persona da una muestra de ADN, a partir de la cual se leen millones de variantes genéticas utilizando matrices SNP . Si un tipo de la variante (un alelo ) es más frecuente en personas con la enfermedad, se dice que la variante está asociada con la enfermedad. Se considera que los SNP asociados marcan una región del genoma humano que puede influir en el riesgo de enfermedad.
Los estudios de GWA investigan el genoma completo, en contraste con los métodos que prueban específicamente una pequeña cantidad de regiones genéticas preespecificadas. Por lo tanto, GWAS es un enfoque no impulsado por candidatos , en contraste con los estudios impulsados por candidatos específicos de genes . Los estudios de GWA identifican SNP y otras variantes en el ADN asociadas con una enfermedad, pero no pueden por sí solos especificar qué genes son causales. [2] [3] [4]
El primer GWAS exitoso publicado en 2002 estudió el infarto de miocardio. [5] Este diseño de estudio se implementó luego en el estudio histórico GWA 2005 que investigaba a pacientes con degeneración macular relacionada con la edad , y encontró dos SNP con una frecuencia de alelos significativamente alterada en comparación con los controles sanos. [6] A partir de 2017 [actualizar], más de 3.000 estudios de GWA en humanos han examinado más de 1.800 enfermedades y rasgos, y se han encontrado miles de asociaciones de SNP. [7] Excepto en el caso de las enfermedades genéticas raras , estas asociaciones son muy débiles, pero aunque es posible que no expliquen gran parte del riesgo, proporcionan información sobre genes y vías que pueden ser importantes.
Fondo
Dos genomas humanos cualesquiera difieren en millones de formas diferentes. Hay pequeñas variaciones en los nucleótidos individuales de los genomas ( SNP ), así como muchas variaciones más grandes, como deleciones , inserciones y variaciones en el número de copias . Cualquiera de estos puede causar alteraciones en los rasgos o el fenotipo de un individuo , que pueden ser desde el riesgo de enfermedad hasta propiedades físicas como la altura. [9] Alrededor del año 2000, antes de la introducción de los estudios de GWA, el método principal de investigación era a través de estudios de herencia de ligamiento genético en familias. Este enfoque ha demostrado ser de gran utilidad para los trastornos de un solo gen . [10] [9] [11] Sin embargo, para las enfermedades comunes y complejas, los resultados de los estudios de ligamiento genético resultaron difíciles de reproducir. [9] [11] Una alternativa sugerida a los estudios de ligamiento fue el estudio de asociación genética . Este tipo de estudio pregunta si el alelo de una variante genética se encuentra con más frecuencia de lo esperado en individuos con el fenotipo de interés (por ejemplo, con la enfermedad en estudio). Los primeros cálculos sobre el poder estadístico indicaron que este enfoque podría ser mejor que los estudios de ligamiento para detectar efectos genéticos débiles. [12]
Además del marco conceptual, varios factores adicionales permitieron los estudios de GWA. Uno fue el advenimiento de los biobancos , que son depósitos de material genético humano que redujeron en gran medida el costo y la dificultad de recolectar un número suficiente de especímenes biológicos para su estudio. [13] Otro fue el Proyecto Internacional HapMap , que, desde 2003, identificó la mayoría de los SNP comunes interrogados en un estudio de GWA. [14] La estructura haplobloque identificada por el proyecto HapMap también permitió centrarse en el subconjunto de SNP que describiría la mayor parte de la variación. Además, el desarrollo de métodos para genotipar todos estos SNP utilizando matrices de genotipado fue un requisito previo importante. [15]
Métodos
El enfoque más común de los estudios de GWA es la configuración de casos y controles , que compara dos grandes grupos de individuos, un grupo de control sano y un grupo de casos afectados por una enfermedad. Todos los individuos de cada grupo están genotipados para la mayoría de los SNP comunes conocidos. El número exacto de SNP depende de la tecnología de genotipado, pero normalmente son un millón o más. [8] Para cada uno de estos SNP, se investiga si la frecuencia de los alelos se altera significativamente entre el caso y el grupo de control. [17] En tales configuraciones, la unidad fundamental para informar los tamaños del efecto es la razón de probabilidades . La razón de probabilidades es la razón de dos probabilidades, que en el contexto de los estudios de GWA son las probabilidades de caso para individuos que tienen un alelo específico y las probabilidades de caso para individuos que no tienen ese mismo alelo.
Como ejemplo, suponga que hay dos alelos, T y C. El número de individuos en el grupo de casos que tiene el alelo T está representado por 'A' y el número de individuos en el grupo de control que tiene el alelo T está representado por 'B' . De manera similar, el número de individuos en el grupo de casos que tiene el alelo C está representado por 'X' y el número de individuos en el grupo de control que tiene el alelo C está representado por 'Y'. En este caso, la razón de probabilidades para el alelo T es A: B (que significa 'A a B', en la terminología de probabilidades estándar) dividida por X: Y, que en notación matemática es simplemente (A / B) / (X / Y).
Cuando la frecuencia de los alelos en el grupo de casos es mucho mayor que en el grupo de control, la razón de posibilidades es mayor que 1, y viceversa para una frecuencia de alelos más baja. Además, un valor P para la significancia de la razón de posibilidades se calcula típicamente usando una prueba simple de chi-cuadrado . Encontrar razones de probabilidades que sean significativamente diferentes de 1 es el objetivo del estudio GWA porque muestra que un SNP está asociado con una enfermedad. [17] Debido a que se prueban tantas variantes, es una práctica estándar exigir que el valor p sea menor que5 × 10 −8 para considerar una variante significativa.
Hay varias variaciones de este enfoque de casos y controles. Una alternativa común a los estudios de casos y controles de GWA es el análisis de datos fenotípicos cuantitativos, por ejemplo, altura o concentraciones de biomarcadores o incluso expresión génica . Asimismo, se pueden utilizar estadísticas alternativas diseñadas para patrones de dominancia o penetrancia recesiva . [17] Los cálculos se realizan normalmente utilizando software bioinformático como SNPTEST y PLINK, que también incluyen soporte para muchas de estas estadísticas alternativas. [16] [18] GWAS se centra en el efecto de los SNP individuales. Sin embargo, también es posible que las interacciones complejas entre dos o más SNP, la epistasis , contribuyan a enfermedades complejas. Debido al número potencialmente exponencial de interacciones, la detección de interacciones estadísticamente significativas en los datos de GWAS es un desafío tanto computacional como estadísticamente. Esta tarea se ha abordado en publicaciones existentes que utilizan algoritmos inspirados en la minería de datos. [19] Además, los investigadores intentan integrar los datos de GWA con otros datos biológicos como la red de interacción proteína-proteína para extraer resultados más informativos. [20] [21]
Un paso clave en la mayoría de los estudios de GWA es la imputación de genotipos en SNP, no en el chip de genotipo utilizado en el estudio. [22] Este proceso aumenta en gran medida el número de SNP cuya asociación se puede probar, aumenta el poder del estudio y facilita el metanálisis de GWAS en distintas cohortes. La imputación del genotipo se lleva a cabo mediante métodos estadísticos que combinan los datos de GWAS junto con un panel de referencia de haplotipos. Estos métodos aprovechan el intercambio de haplotipos entre individuos en tramos cortos de secuencia para imputar alelos. Los paquetes de software existentes para la imputación de genotipos incluyen IMPUTE2, [23] Minimac, Beagle [24] y MaCH. [25]
Además del cálculo de la asociación, es común tener en cuenta cualquier variable que pueda potencialmente confundir los resultados. El sexo y la edad son ejemplos comunes de variables de confusión. Además, también se sabe que muchas variaciones genéticas están asociadas con las poblaciones geográficas e históricas en las que surgieron por primera vez las mutaciones. [26] Debido a esta asociación, los estudios deben tener en cuenta el origen geográfico y étnico de los participantes controlando lo que se llama estratificación de la población . Si no lo hacen, estos estudios pueden producir resultados falsos positivos. [27]
Después de que se hayan calculado las razones de probabilidades y los valores P para todos los SNP, un enfoque común es crear una gráfica de Manhattan . En el contexto de los estudios de GWA, este gráfico muestra el logaritmo negativo del valor P en función de la ubicación genómica. Por lo tanto, los SNP con la asociación más significativa se destacan en la gráfica, generalmente como pilas de puntos debido a la estructura del haplobloque. Es importante destacar que el umbral del valor P de significancia se corrige para múltiples problemas de prueba . El umbral exacto varía según el estudio, [28] pero el umbral convencional es5 × 10 −8 para ser significativo frente a cientos de miles a millones de SNP probados. [8] [17] [29] Los estudios de GWA suelen realizar el primer análisis en una cohorte de descubrimiento, seguido de la validación de los SNP más importantes en una cohorte de validación independiente. [30]
Resultados
Se ha intentado crear catálogos completos de SNP que se han identificado a partir de estudios de GWA. [32] En 2009, los SNP asociados con enfermedades se contaban por miles. [33]
El primer estudio de GWA, realizado en 2005, comparó a 96 pacientes con degeneración macular relacionada con la edad (DMAE) con 50 controles sanos. [34] Identificó dos SNP con una frecuencia de alelos significativamente alterada entre los dos grupos. Estos SNP se ubicaron en el gen que codifica el factor del complemento H , lo que fue un hallazgo inesperado en la investigación de ARMD. Los hallazgos de estos primeros estudios de GWA han impulsado posteriormente una mayor investigación funcional hacia la manipulación terapéutica del sistema del complemento en ARMD. [35] Otra publicación histórica en la historia de los estudios de GWA fue el estudio Wellcome Trust Case Control Consortium (WTCCC), el estudio de GWA más grande jamás realizado en el momento de su publicación en 2007. El WTCCC incluyó 14.000 casos de siete enfermedades comunes (~ 2,000 personas por cada enfermedad coronaria , diabetes tipo 1 , diabetes tipo 2 , artritis reumatoide , enfermedad de Crohn , trastorno bipolar e hipertensión ) y 3,000 controles compartidos. [16] Este estudio tuvo éxito en descubrir muchos genes nuevos de enfermedades subyacentes a estas enfermedades. [16] [36]
Desde estos primeros estudios históricos de GWA, ha habido dos tendencias generales. [37] Uno ha sido hacia tamaños de muestra cada vez más grandes. En 2018, varios estudios de asociación de todo el genoma están alcanzando un tamaño de muestra total de más de 1 millón de participantes, incluidos 1,1 millones en un estudio de nivel educativo de todo el genoma [38] y un estudio de insomnio con 1,3 millones de personas. [39] La razón es el impulso hacia la detección confiable de riesgos-SNP que tienen menores razones de probabilidad y menor frecuencia de alelos. Otra tendencia ha sido hacia el uso de fenotipos más definidos, como lípidos sanguíneos , proinsulina o biomarcadores similares. [40] [41] Estos se denominan fenotipos intermedios y sus análisis pueden ser valiosos para la investigación funcional de biomarcadores. [42] Una variación de GWAS utiliza participantes que son parientes de primer grado de personas con una enfermedad. Este tipo de estudio se ha denominado estudio de asociación de genoma completo por proxy ( GWAX ). [43]
Un punto central de debate sobre los estudios de GWA ha sido que la mayoría de las variaciones de SNP encontradas por los estudios de GWA están asociadas con un pequeño aumento del riesgo de la enfermedad y tienen solo un pequeño valor predictivo. La mediana de la razón de probabilidades es 1,33 por riesgo-SNP, y solo unos pocos muestran razones de probabilidades superiores a 3,0. [2] [44] Estas magnitudes se consideran pequeñas porque no explican gran parte de la variación hereditaria. Esta variación hereditaria se estima a partir de estudios de heredabilidad basados en gemelos monocigóticos . [45] Por ejemplo, se sabe que el 80-90% de la variación en la altura puede explicarse por diferencias hereditarias, pero los estudios de GWA solo explican una minoría de esta variación. [45]
Aplicaciones clínicas
Un desafío para el futuro estudio exitoso de GWA es aplicar los hallazgos de una manera que acelere el desarrollo de fármacos y diagnósticos, incluida una mejor integración de los estudios genéticos en el proceso de desarrollo de fármacos y un enfoque en el papel de la variación genética en el mantenimiento de la salud como modelo para diseñar nuevos fármacos y diagnósticos . [46] Varios estudios han examinado el uso de marcadores SNP de riesgo como un medio para mejorar directamente la precisión del pronóstico . Algunos han descubierto que la precisión del pronóstico mejora, [47] mientras que otros informan solo beneficios menores de este uso. [48] Generalmente, un problema con este enfoque directo son las pequeñas magnitudes de los efectos observados. Un pequeño efecto se traduce en última instancia en una mala separación de casos y controles y, por lo tanto, solo una pequeña mejora de la precisión del pronóstico. Por tanto, una aplicación alternativa es el potencial de los estudios de GWA para dilucidar la fisiopatología . [49]
Uno de esos éxitos está relacionado con la identificación de la variante genética asociada con la respuesta al tratamiento contra el virus de la hepatitis C. Para la hepatitis C de genotipo 1 tratada con interferón-alfa-2a pegilado o interferón-alfa-2b pegilado combinado con ribavirina , un estudio de GWA [50] ha demostrado que los SNP cercanos al gen humano IL28B , que codifica el interferón lambda 3, se asocian con diferencias significativas en respuesta al tratamiento. Un informe posterior demostró que las mismas variantes genéticas también están asociadas con la eliminación natural del virus de la hepatitis C del genotipo 1. [51] Estos importantes hallazgos facilitaron el desarrollo de la medicina personalizada y permitieron a los médicos personalizar las decisiones médicas basadas en el genotipo del paciente. [52]
El objetivo de dilucidar la fisiopatología también ha aumentado el interés en la asociación entre los SNP de riesgo y la expresión génica de genes cercanos, los denominados estudios de loci de rasgos cuantitativos de expresión (eQTL). [53] La razón es que los estudios de GWAS identifican los SNP de riesgo, pero no los genes de riesgo, y la especificación de los genes es un paso más hacia los objetivos farmacológicos procesables . Como resultado, los principales estudios de GWA para 2011 generalmente incluían un análisis extenso de eQTL. [54] [55] [56] Uno de los efectos eQTL más fuertes observados para un SNP de riesgo identificado por GWA es el locus SORT1. [40] Los estudios de seguimiento funcional de este locus utilizando pequeños ARN de interferencia y ratones con genes knock-out arrojaron luz sobre el metabolismo de las lipoproteínas de baja densidad , que tienen importantes implicaciones clínicas para las enfermedades cardiovasculares . [40] [57] [58]
Fibrilación auricular
Por ejemplo, un metanálisis realizado en 2018 reveló el descubrimiento de 70 nuevos loci asociados con la fibrilación auricular . Se han identificado diferentes variantes asociadas a genes codificantes de factores de transcripción , como TBX3 y TBX5 , NKX2-5 o PITX2 , que intervienen en la regulación de la conducción cardíaca, en la modulación de los canales iónicos y en el desarrollo cardíaco. También se identificaron nuevos genes implicados en la taquicardia ( CASQ2 ) o asociados con la alteración de la comunicación celular del músculo cardíaco ( PKP2 ). [59]
Esquizofrenia
Si bien hay algunas investigaciones que utilizan un modelo computacional de predicción de interacción de proteínas de alta precisión (HiPPIP) que descubrió 504 nuevas interacciones proteína-proteína (PPI) asociadas con genes relacionados con la esquizofrenia , [60] [61] la evidencia que respalda la base genética de la esquizofrenia es realmente controvertido y puede sufrir algunas de las limitaciones de este método de estudio. [62]
Aplicaciones agrícolas
Etapas de crecimiento de la planta y componentes del rendimiento.
Los estudios de GWA actúan como una herramienta importante en el fitomejoramiento. Con grandes datos de genotipado y fenotipado, GWAS es poderoso para analizar modos de herencia complejos de rasgos que son componentes importantes del rendimiento, como el número de granos por espiga, el peso de cada grano y la estructura de la planta. En un estudio sobre GWAS en trigo de primavera, GWAS reveló una fuerte correlación de la producción de granos con los datos de arranque, la biomasa y el número de granos por espiga. [63]
Patógenos vegetales
Las emergencias de patógenos vegetales han planteado graves amenazas para la salud y la biodiversidad de las plantas. Bajo esta consideración, la identificación de tipos silvestres que tengan la resistencia natural a ciertos patógenos podría ser de vital importancia. Además, necesitamos predecir qué alelos están asociados con la resistencia. Los estudios de GWA son una herramienta poderosa para detectar las relaciones de ciertas variantes y la resistencia al patógeno de la planta, lo cual es beneficioso para desarrollar nuevos cultivares resistentes a patógenos. [64]
Limitaciones
Los estudios de GWA tienen varios problemas y limitaciones que se pueden solucionar mediante un control de calidad y una configuración del estudio adecuados. La falta de grupos de casos y controles bien definidos, el tamaño de la muestra insuficiente, el control de pruebas múltiples y el control de la estratificación de la población son problemas comunes. [3] En particular, la cuestión estadística de las pruebas múltiples en la que se ha observado que "el enfoque de GWA puede ser problemático porque la gran cantidad de pruebas estadísticas realizadas presenta un potencial sin precedentes de resultados falsos positivos ". [3] Se ha citado que ignorar estos problemas corregibles contribuye a una sensación general de problemas con la metodología GWA. [65] Además de problemas fácilmente corregibles como estos, han surgido algunos problemas más sutiles pero importantes. Un estudio de GWA de alto perfil que investigó a personas con una vida útil muy larga para identificar los SNP asociados con la longevidad es un ejemplo de esto. [66] La publicación fue objeto de escrutinio debido a una discrepancia entre el tipo de matriz de genotipado en el grupo de casos y control, lo que provocó que varios SNP se resaltaran falsamente como asociados con la longevidad. [67] El estudio se retiró posteriormente , [68] pero más tarde se publicó un manuscrito modificado. [69]
Además de estos problemas prevenibles, los estudios de GWA han atraído críticas más fundamentales, principalmente debido a su suposición de que la variación genética común juega un papel importante en la explicación de la variación hereditaria de una enfermedad común. [70] De hecho, se ha estimado que para la mayoría de las condiciones, la heredabilidad de SNP atribuible a SNP comunes es <0,05. [71] Este aspecto de los estudios GWA ha atraído la crítica de que, aunque no podría haberse conocido prospectivamente, los estudios GWA finalmente no valieron la pena el gasto. [49] Los estudios de GWA también enfrentan críticas de que la amplia variación de las respuestas individuales o los mecanismos compensatorios a un estado de enfermedad cancelan y enmascaran genes potenciales o variantes causales asociadas con la enfermedad. [72] Además, los estudios de GWA identifican variantes de riesgo candidatas para la población a partir de la cual se realiza su análisis, y dado que la mayoría de los estudios de GWA provienen de bases de datos europeas, hay una falta de traducción de las variantes de riesgo identificadas a otras poblaciones no europeas. [73] Las estrategias alternativas sugeridas incluyen el análisis de vínculos . [74] [75] Más recientemente, el precio rápidamente decreciente de la secuenciación completa del genoma también ha proporcionado una alternativa realista a los estudios de GWA basados en matrices de genotipos . Se puede discutir si el uso de esta nueva técnica todavía se conoce como un estudio de GWA, pero la secuenciación de alto rendimiento tiene el potencial de eludir algunas de las deficiencias de la GWA sin secuenciación. [76]
Mapeo fino
Las matrices de genotipado diseñadas para GWAS se basan en el desequilibrio de ligamiento para proporcionar cobertura de todo el genoma mediante la genotipificación de un subconjunto de variantes. Debido a esto, es poco probable que las variantes asociadas informadas sean las variantes causales reales. Las regiones asociadas pueden contener cientos de variantes que abarcan grandes regiones y abarcan muchos genes diferentes, lo que dificulta la interpretación biológica de los loci GWAS. El mapeo fino es un proceso para refinar estas listas de variantes asociadas a un conjunto creíble que probablemente incluya la variante causal.
El mapeo fino requiere que todas las variantes en la región asociada hayan sido genotipadas o imputadas (cobertura densa), un control de calidad muy estricto que da como resultado genotipos de alta calidad y tamaños de muestra grandes suficientes para separar señales altamente correlacionadas. Existen varios métodos diferentes para realizar un mapeo fino, y todos los métodos producen una probabilidad posterior de que una variante en ese locus sea causal. Debido a que los requisitos son a menudo difíciles de satisfacer, todavía hay ejemplos limitados de estos métodos que se aplican de manera más general.
Ver también
- Mapeo de asociaciones
- Epidemiología
- Interacción gen-ambiente
- Genómica
- Desequilibrio de ligamiento
- Epidemiología molecular
- Puntuación poligénica
Referencias
- ^ Ikram MK, Sim X, Xueling S, Jensen RA, Cotch MF, Hewitt AW, et al. (Octubre de 2010). McCarthy MI (ed.). "Cuatro nuevos Loci (19q13, 6q24, 12q24 y 5q14) influyen en la microcirculación in vivo" . PLOS Genetics . 6 (10): e1001184. doi : 10.1371 / journal.pgen.1001184 . PMC 2965750 . PMID 21060863 .
- ^ a b Manolio TA (julio de 2010). "Estudios de asociación del genoma y evaluación del riesgo de enfermedad". La Revista de Medicina de Nueva Inglaterra . 363 (2): 166–76. doi : 10.1056 / NEJMra0905980 . PMID 20647212 .
- ^ a b c Pearson TA, Manolio TA (marzo de 2008). "Cómo interpretar un estudio de asociación de todo el genoma". JAMA . 299 (11): 1335–44. doi : 10.1001 / jama.299.11.1335 . PMID 18349094 .
- ^ "Estudios de asociación de todo el genoma" . Instituto Nacional de Investigación del Genoma Humano .
- ^ Ozaki K, Ohnishi Y, Iida A, Sekine A, Yamada R, Tsunoda T, et al. (Diciembre de 2002). "SNP funcionales en el gen de la linfotoxina-alfa que se asocian con la susceptibilidad al infarto de miocardio" . Genética de la naturaleza . 32 (4): 650–4. doi : 10.1038 / ng1047 . PMID 12426569 . S2CID 21414260 .
- ^ Klein RJ, Zeiss C, Chew EY, Tsai JY, Sackler RS, Haynes C, et al. (Abril de 2005). "Polimorfismo del factor H complementario en la degeneración macular relacionada con la edad" . Ciencia . 308 (5720): 385–9. Código bibliográfico : 2005Sci ... 308..385K . doi : 10.1126 / science.1109557 . PMC 1512523 . PMID 15761122 .
- ^ "Catálogo GWAS: el catálogo NHGRI-EBI de estudios de asociación de genoma publicados" . Laboratorio Europeo de Biología Molecular . Laboratorio Europeo de Biología Molecular . Consultado el 18 de abril de 2017 .
- ^ a b c Bush WS, Moore JH (2012). Lewitter F, Kann M (eds.). "Capítulo 11: estudios de asociación de todo el genoma" . PLOS Biología Computacional . 8 (12): e1002822. Código bibliográfico : 2012PLSCB ... 8E2822B . doi : 10.1371 / journal.pcbi.1002822 . PMC 3531285 . PMID 23300413 .
- ^ a b c Strachan T, Leer A (2011). Genética molecular humana (4ª ed.). Garland Science. págs. 467 –495. ISBN 978-0-8153-4149-9.
- ^ "Herencia mendeliana en línea en el hombre" . Archivado desde el original el 5 de diciembre de 2011 . Consultado el 6 de diciembre de 2011 .
- ^ a b Altmüller J, Palmer LJ, Fischer G, Scherb H, Wjst M (noviembre de 2001). "Exploraciones de todo el genoma de enfermedades humanas complejas: es difícil encontrar una verdadera vinculación" . Revista Estadounidense de Genética Humana . 69 (5): 936–50. doi : 10.1086 / 324069 . PMC 1274370 . PMID 11565063 .
- ^ Risch N, Merikangas K (septiembre de 1996). "El futuro de los estudios genéticos de enfermedades humanas complejas". Ciencia . 273 (5281): 1516–7. Código Bibliográfico : 1996Sci ... 273.1516R . doi : 10.1126 / science.273.5281.1516 . PMID 8801636 . S2CID 5228523 .
- ^ Greely HT (2007). "Los incómodos fundamentos éticos y legales de los biobancos genómicos a gran escala". Revisión anual de genómica y genética humana . 8 : 343–64. doi : 10.1146 / annurev.genom.7.080505.115721 . PMID 17550341 .
- ^ El Proyecto Internacional HapMap, Gibbs RA, Belmont JW, Hardenbol P, Willis TD, Yu F, Yang H, Ch'Ang LY, Huang W (diciembre de 2003). "El Proyecto Internacional HapMap" (PDF) . Naturaleza . 426 (6968): 789–96. Código Bibliográfico : 2003Natur.426..789G . doi : 10.1038 / nature02168 . hdl : 2027,42 / 62838 . PMID 14685227 . S2CID 4387110 .
- ^ Schena M, Shalon D, Davis RW, Brown PO (octubre de 1995). "Monitoreo cuantitativo de patrones de expresión génica con un microarray de ADN complementario". Ciencia . 270 (5235): 467–70. Código Bibliográfico : 1995Sci ... 270..467S . doi : 10.1126 / science.270.5235.467 . PMID 7569999 . S2CID 6720459 .
- ^ a b c d Wellcome Trust Case Control Consortium, Burton PR (junio de 2007). "Estudio de asociación de todo el genoma de 14.000 casos de siete enfermedades comunes y 3.000 controles compartidos" . Naturaleza . 447 (7145): 661–78. Código Bibliográfico : 2007Natur.447..661B . doi : 10.1038 / nature05911 . PMC 2719288 . PMID 17554300 .
- ^ a b c d Clarke GM, Anderson CA, Pettersson FH, Cardon LR, Morris AP, Zondervan KT (febrero de 2011). "Análisis estadístico básico en estudios genéticos de casos y controles" . Protocolos de la naturaleza . 6 (2): 121–33. doi : 10.1038 / nprot.2010.182 . PMC 3154648 . PMID 21293453 .
- ^ Purcell S, Neale B, Todd-Brown K, Thomas L, Ferreira MA, Bender D, et al. (Septiembre de 2007). "PLINK: un conjunto de herramientas para la asociación de todo el genoma y análisis de vinculación basados en la población" . Revista Estadounidense de Genética Humana . 81 (3): 559–75. doi : 10.1086 / 519795 . PMC 1950838 . PMID 17701901 .
- ^ Llinares-López F, Grimm DG, Bodenham DA, Gieraths U, Sugiyama M, Rowan B, Borgwardt K (junio de 2015). "Detección en todo el genoma de intervalos de heterogeneidad genética asociados con rasgos complejos" . Bioinformática . 31 (12): i240-9. doi : 10.1093 / bioinformatics / btv263 . PMC 4559912 . PMID 26072488 .
- ^ Ayati M, Erten S, Chance MR, Koyutürk M (diciembre de 2015). "MOBAS: identificación de subredes de proteínas asociadas a enfermedades mediante puntuación basada en modularidad" . Revista EURASIP de Bioinformática y Biología de Sistemas . 2015 (1): 7. doi : 10.1186 / s13637-015-0025-6 . PMC 5270451 . PMID 28194175 .
- ^ Ayati M, Koyutürk M (1 de enero de 2015). "Evaluación de la asociación de enfermedades colectivas de múltiples loci genómicos". Actas de la VI Conferencia ACM sobre Bioinformática, Biología Computacional e Informática de la Salud . BCB '15. Nueva York, NY, EE.UU .: ACM. págs. 376–385. doi : 10.1145 / 2808719.2808758 . ISBN 978-1-4503-3853-0. S2CID 5942777 .
- ^ Marchini J, Howie B (julio de 2010). "Imputación de genotipo para estudios de asociación de todo el genoma". Nature Reviews Genética . 11 (7): 499–511. doi : 10.1038 / nrg2796 . PMID 20517342 . S2CID 1465707 .
- ^ Howie B, Marchini J, Stephens M (noviembre de 2011). "Imputación de genotipo con miles de genomas" . G3 . 1 (6): 457–70. doi : 10.1534 / g3.111.001198 . PMC 3276165 . PMID 22384356 .
- ^ Browning BL, Browning SR (febrero de 2009). "Un enfoque unificado para la imputación de genotipos y la inferencia de fase de haplotipo para grandes conjuntos de datos de tríos e individuos no relacionados" . Revista Estadounidense de Genética Humana . 84 (2): 210-23. doi : 10.1016 / j.ajhg.2009.01.005 . PMC 2668004 . PMID 19200528 .
- ^ Li Y, Willer CJ, Ding J, Scheet P, Abecasis GR (diciembre de 2010). "MaCH: utilizando datos de secuencia y genotipo para estimar haplotipos y genotipos no observados" . Epidemiología genética . 34 (8): 816–34. doi : 10.1002 / gepi.20533 . PMC 3175618 . PMID 21058334 .
- ^ Novembre J, Johnson T, Bryc K, Kutalik Z, Boyko AR, Auton A, Indap A, King KS, Bergmann S, Nelson MR, Stephens M, Bustamante CD (noviembre de 2008). "Los genes reflejan la geografía dentro de Europa" . Naturaleza . 456 (7218): 98–101. Código Bibliográfico : 2008Natur.456 ... 98N . doi : 10.1038 / nature07331 . PMC 2735096 . PMID 18758442 .
- ^ Charney E (enero de 2017). "Genes, comportamiento y genética del comportamiento". Revisiones interdisciplinarias de Wiley. Ciencia cognitiva . 8 (1–2): e1405. doi : 10.1002 / wcs.1405 . hdl : 10161/13337 . PMID 27906529 .
- ^ Wittkowski KM, Sonakya V, Bigio B, Tonn MK, Shic F, Ascano M, Nasca C, Gold-Von Simson G (enero de 2014). "Un nuevo enfoque de bioestadística computacional implica una desfosforilación deficiente de los receptores del factor de crecimiento asociados con la gravedad del autismo" . Psiquiatría traslacional . 4 (1): e354. doi : 10.1038 / tp.2013.124 . PMC 3905234 . PMID 24473445 .
- ^ Barsh GS, Copenhaver GP, Gibson G, Williams SM (julio de 2012). "Directrices para estudios de asociación de todo el genoma" . PLOS Genetics . 8 (7): e1002812. doi : 10.1371 / journal.pgen.1002812 . PMC 3390399 . PMID 22792080 .
- ^ Smith SM, Douaud G, Chen W, Hanayik T, Alfaro-Almagro F, Sharp K, Elliott LT (2021). "Un conjunto ampliado de estudios de asociación de genoma completo de fenotipos de imágenes cerebrales en el Biobanco del Reino Unido" . Nat Neurosci . doi : 10.1038 / s41593-021-00826-4 . PMID 33875891 .CS1 maint: varios nombres: lista de autores ( enlace )
- ^ Sanna S, Li B, Mulas A, Sidore C, Kang HM, Jackson AU, et al. (Julio de 2011). Gibson G (ed.). "El mapeo fino de cinco loci asociados con el colesterol de lipoproteínas de baja densidad detecta variantes que duplican la heredabilidad explicada" . PLOS Genetics . 7 (7): e1002198. doi : 10.1371 / journal.pgen.1002198 . PMC 3145627 . PMID 21829380 .
- ^ Hindorff LA, Sethupathy P, Junkins HA, Ramos EM, Mehta JP, Collins FS, Manolio TA (junio de 2009). "Posibles implicaciones etiológicas y funcionales de los loci de asociación de todo el genoma para las enfermedades y los rasgos humanos" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 106 (23): 9362–7. Código bibliográfico : 2009PNAS..106.9362H . doi : 10.1073 / pnas.0903103106 . PMC 2687147 . PMID 19474294 .
- ^ Johnson AD, O'Donnell CJ (enero de 2009). "Una base de datos de acceso abierto de los resultados de la asociación de todo el genoma" . Genética Médica de BMC . 10 : 6. Doi : 10.1186 / 1471-2350-10-6 . PMC 2639349 . PMID 19161620 .
- ^ Haines JL, Hauser MA, Schmidt S, Scott WK, Olson LM, Gallins P, Spencer KL, Kwan SY, Noureddine M, Gilbert JR, Schnetz-Boutaud N, Agarwal A, Postel EA, Pericak-Vance MA (abril de 2005). "La variante del factor H del complemento aumenta el riesgo de degeneración macular relacionada con la edad". Ciencia . 308 (5720): 419–21. Código bibliográfico : 2005Sci ... 308..419H . doi : 10.1126 / science.1110359 . PMID 15761120 . S2CID 32716116 .
- ^ Fridkis-Hareli M, Storek M, Mazsaroff I, Risitano AM, Lundberg AS, Horvath CJ, Holers VM (octubre de 2011). "Diseño y desarrollo de TT30, un nuevo inhibidor de convertasa C3 / C5 dirigido a C3d para el tratamiento de enfermedades mediadas por vías alternativas del complemento humano" . Sangre . 118 (17): 4705-13. doi : 10.1182 / sangre-2011-06-359646 . PMC 3208285 . PMID 21860027 .
- ^ "El estudio más grande jamás publicado sobre genética de enfermedades comunes" (Comunicado de prensa). Consorcio de control de casos de Wellcome Trust. 6 de junio de 2007 . Consultado el 19 de junio de 2008 .
- ^ Ioannidis JP, Thomas G, Daly MJ (mayo de 2009). "Validación, aumento y refinamiento de señales de asociación de todo el genoma" . Nature Reviews Genética . 10 (5): 318-29. doi : 10.1038 / nrg2544 . PMC 7877552 . PMID 19373277 . S2CID 6463743 .
- ^ Lee JJ, Wedow R, Okbay A, Kong E, Maghzian O, Zacher M, Nguyen-Viet TA, Bowers P, Sidorenko J, Karlsson Linnér R, et al. (Julio de 2018). "Descubrimiento de genes y predicción poligénica de un estudio de asociación de todo el genoma del logro educativo en 1,1 millones de personas" . Genética de la naturaleza . 50 (8): 1112-1121. doi : 10.1038 / s41588-018-0147-3 . PMC 6393768 . PMID 30038396 .
- ^ Jansen PR, Watanabe K, Stringer S, Skene N, Bryois J, Hammerschlag AR, et al. (Enero de 2018). "Análisis de todo el genoma del insomnio (N = 1,331,010) identifica nuevos loci y vías funcionales" . doi : 10.1101 / 214973 . Cite journal requiere
|journal=
( ayuda ) - ^ a b c Kathiresan S, Willer CJ, Peloso GM, Demissie S, Musunuru K, Schadt EE, et al. (Enero de 2009). "Las variantes comunes en 30 loci contribuyen a la dislipidemia poligénica" . Genética de la naturaleza . 41 (1): 56–65. doi : 10.1038 / ng.291 . PMC 2881676 . PMID 19060906 .
- ^ Strawbridge RJ, Dupuis J , Prokopenko I, Barker A, Ahlqvist E, Rybin D y col. (Octubre de 2011). "La asociación de todo el genoma identifica nueve variantes comunes asociadas con los niveles de proinsulina en ayunas y proporciona nuevos conocimientos sobre la fisiopatología de la diabetes tipo 2" . Diabetes . 60 (10): 2624–34. doi : 10.2337 / db11-0415 . PMC 3178302 . PMID 21873549 .
- ^ Danesh J, Pepys MB (noviembre de 2009). "Proteína C reactiva y enfermedad coronaria: ¿existe una relación causal?" . Circulación . 120 (21): 2036–9. doi : 10.1161 / CIRCULATIONAHA.109.907212 . PMID 19901186 .
- ^ Liu JZ, Erlich Y, Pickrell JK (marzo de 2017). "Mapeo de asociación de casos y controles por proxy utilizando antecedentes familiares de enfermedad". Genética de la naturaleza . 49 (3): 325–331. doi : 10.1038 / ng.3766 . PMID 28092683 . S2CID 5598845 .
- ^ Ku CS, Loy EY, Pawitan Y, Chia KS (abril de 2010). "La búsqueda de estudios de asociación de todo el genoma: ¿dónde estamos ahora?" . Revista de Genética Humana . 55 (4): 195–206. doi : 10.1038 / jhg.2010.19 . PMID 20300123 .
- ^ a b Maher B (noviembre de 2008). "Genomas personales: el caso de la heredabilidad faltante" . Naturaleza . 456 (7218): 18-21. doi : 10.1038 / 456018a . PMID 18987709 .
- ^ Iadonato SP, Katze MG (septiembre de 2009). "Genómica: el virus de la hepatitis C se vuelve personal" . Naturaleza . 461 (7262): 357–8. Código Bibliográfico : 2009Natur.461..357I . doi : 10.1038 / 461357a . PMID 19759611 . S2CID 7602652 .
- ^ Muehlschlegel JD, Liu KY, Perry TE, Fox AA, Collard CD, Shernan SK, Body SC (septiembre de 2010). "La variante del cromosoma 9p21 predice la mortalidad después de la cirugía de injerto de bypass de arteria coronaria" . Circulación . 122 (Supl. 11): S60–5. doi : 10.1161 / CIRCULATIONAHA.109.924233 . PMC 2943860 . PMID 20837927 .
- ^ Paynter NP, Chasman DI, Paré G, Buring JE, Cook NR, Miletich JP, Ridker PM (febrero de 2010). "Asociación entre una puntuación de riesgo genético basada en la literatura y eventos cardiovasculares en mujeres" . JAMA . 303 (7): 631–7. doi : 10.1001 / jama.2010.119 . PMC 2845522 . PMID 20159871 .
- ^ a b Couzin-Frankel J (junio de 2010). "Los genes de las principales enfermedades cardíacas resultan esquivos". Ciencia . 328 (5983): 1220–1. Código bibliográfico : 2010Sci ... 328.1220C . doi : 10.1126 / science.328.5983.1220 . PMID 20522751 .
- ^ Ge D, Fellay J, Thompson AJ, Simon JS, Shianna KV, Urban TJ, Heinzen EL, Qiu P, Bertelsen AH, Muir AJ, Sulkowski M, McHutchison JG, Goldstein DB (septiembre de 2009). "La variación genética en IL28B predice el aclaramiento viral inducido por el tratamiento de la hepatitis C". Naturaleza . 461 (7262): 399–401. Código Bibliográfico : 2009Natur.461..399G . doi : 10.1038 / nature08309 . PMID 19684573 . S2CID 1707096 .
- ^ Thomas DL, Thio CL, Martin MP, Qi Y, Ge D, O'Huigin C, Kidd J, Kidd K, Khakoo SI, Alexander G, Goedert JJ, Kirk GD, Donfield SM, Rosen HR, Tobler LH, Busch MP, McHutchison JG, Goldstein DB, Carrington M (octubre de 2009). "Variación genética en IL28B y aclaramiento espontáneo del virus de la hepatitis C" . Naturaleza . 461 (7265): 798–801. Código Bibliográfico : 2009Natur.461..798T . doi : 10.1038 / nature08463 . PMC 3172006 . PMID 19759533 .
- ^ Lu YF, Goldstein DB, Angrist M, Cavalleri G (julio de 2014). "Medicina personalizada y diversidad genética humana" . Perspectivas de Cold Spring Harbor en Medicina . 4 (9): a008581. doi : 10.1101 / cshperspect.a008581 . PMC 4143101 . PMID 25059740 .
- ^ Folkersen L, van't Hooft F, Chernogubova E, Agardh HE, Hansson GK, Hedin U, Liska J, Syvänen AC, Paulsson-Berne G, Paulssson-Berne G, Franco-Cereceda A, Hamsten A, Gabrielsen A, Eriksson P (Agosto de 2010). "La asociación de variantes de riesgo genético con la expresión de genes proximales identifica nuevos genes de susceptibilidad a la enfermedad cardiovascular" . Circulación: Genética cardiovascular . 3 (4): 365–73. doi : 10.1161 / CIRCGENETICS.110.948935 . PMID 20562444 .
- ^ Bown MJ, Jones GT, Harrison SC, Wright BJ, Bumpstead S, Baas AF, et al. (Noviembre de 2011). "El aneurisma de la aorta abdominal se asocia con una variante de la proteína 1 relacionada con el receptor de lipoproteínas de baja densidad" . Revista Estadounidense de Genética Humana . 89 (5): 619–27. doi : 10.1016 / j.ajhg.2011.10.002 . PMC 3213391 . PMID 22055160 .
- ^ Consorcio de Genética de la Enfermedad de las Arterias Coronarias (C4D) (marzo de 2011). "Un estudio de asociación de todo el genoma en europeos y sudasiáticos identifica cinco nuevos loci para la enfermedad de las arterias coronarias" . Genética de la naturaleza . 43 (4): 339–44. doi : 10.1038 / ng.782 . PMID 21378988 . S2CID 39712343 .
- ^ Johnson T, Gaunt TR, Newhouse SJ, Padmanabhan S, Tomaszewski M, Kumari M, et al. (Diciembre de 2011). "Loci de presión arterial identificados con una matriz centrada en el gen" . Revista Estadounidense de Genética Humana . 89 (6): 688–700. doi : 10.1016 / j.ajhg.2011.10.013 . PMC 3234370 . PMID 22100073 .
- ^ Dubé JB, Johansen CT, Hegele RA (junio de 2011). "Sortilina: un sospechoso inusual en el metabolismo del colesterol: desde la identificación de GWAS hasta los análisis bioquímicos in vivo, la sortilina se ha identificado como un nuevo mediador del metabolismo de las lipoproteínas humanas". BioEssays . 33 (6): 430–7. doi : 10.1002 / bies.201100003 . PMID 21462369 .
- ^ Bauer RC, Stylianou IM, Rader DJ (abril de 2011). "Validación funcional de nuevas vías en el metabolismo de las lipoproteínas identificadas por la genética humana". Opinión actual en lipidología . 22 (2): 123–8. doi : 10.1097 / MOL.0b013e32834469b3 . PMID 21311327 . S2CID 24020035 .
- ^ Roselli C, Chafin M, Weng L (2018). "Estudio de asociación de todo el genoma multiétnico para la fibrilación auricular" . Genética de la naturaleza . 50 (9): 1225-1233. doi : 10.1038 / s41588-018-0133-9 . PMC 6136836 . PMID 29892015 .
- ^ Ganapathiraju MK, Thahir M, Handen A, Sarkar SN, Sweet RA, Nimgaonkar VL, Loscher CE, Bauer EM, Chaparala S (27 de abril de 2016). "Interactoma de la esquizofrenia con 504 interacciones proteína-proteína novedosas" . NPJ esquizofrenia . 2 : 16012. doi : 10.1038 / npjschz.2016.12 . PMC 4898894 . PMID 27336055 . Resumen de Lay - psychcentral.com .
- ^ Ganapathiraju M, Chaparala S, Lo C (abril de 2018). "F200. Dilucidar el papel de los cilios en las enfermedades neuropsiquiátricas a través del análisis de Interactome" . Boletín de esquizofrenia . 44 (supl_1): S298-9. doi : 10.1093 / schbul / sby017.731 . PMC 5887623 .
- ^ Johnson EC, Border R, Melroy-Greif WE, de Leeuw CA, Ehringer MA, Keller MC (noviembre de 2017). "No hay evidencia de que los genes candidatos a la esquizofrenia estén más asociados con la esquizofrenia que los genes no candidatos" . Psiquiatría biológica . 82 (10): 702–708. doi : 10.1016 / j.biopsych.2017.06.033 . PMC 5643230 . PMID 28823710 .
- ^ Turuspekov Y, Baibulatova A, Yermekbayev K, Tokhetova L, Chudinov V, Sereda G, et al. (Noviembre de 2017). "GWAS para etapas de crecimiento vegetal y componentes de rendimiento en trigo de primavera (Triticum aestivum L.) cosechado en tres regiones de Kazajstán" . Biología Vegetal BMC . 17 (Supl. 1): 190. doi : 10.1186 / s12870-017-1131-2 . PMC 5688510 . PMID 29143598 .
- ^ Bartoli C, Roux F (2017). "Estudios de asociación de todo el genoma en patosistemas vegetales: hacia un enfoque de genómica ecológica" . Fronteras en la ciencia de las plantas . 8 : 763. doi : 10.3389 / fpls.2017.00763 . PMC 5441063 . PMID 28588588 .
- ^ Pickrell J, Barrett J, MacArthur D, Jostins L (23 de noviembre de 2011). "El tamaño importa y otras lecciones de la genética médica" . Genomas descomprimidos . Consultado el 7 de diciembre de 2011 .
- ^ Sebastiani P, Solovieff N, Puca A, Hartley SW, Melista E, Andersen S, Dworkis DA, Wilk JB, Myers RH, Steinberg MH, Montano M, Baldwin CT, Perls TT (julio de 2010). "Firmas genéticas de excepcional longevidad en humanos" . Ciencia . 2010 . doi : 10.1126 / science.1190532 . PMID 20595579 . (Retraído)
- ^ MacArthur D (8 de julio de 2010). "Graves fallas reveladas en" estudio de genes de longevidad " . Cableado . Consultado el 7 de diciembre de 2011 .
- ^ Sebastiani P, Solovieff N, Puca A, Hartley SW, Melista E, Andersen S, Dworkis DA, Wilk JB, Myers RH, Steinberg MH, Montano M, Baldwin CT, Perls TT (julio de 2011). "Retracción". Ciencia . 333 (6041): 404. doi : 10.1126 / science.333.6041.404-a . PMID 21778381 .
- ^ Sebastiani P, Solovieff N, Dewan AT, Walsh KM, Puca A, Hartley SW, Melista E, Andersen S, Dworkis DA, Wilk JB, Myers RH, Steinberg MH, Montano M, Baldwin CT, Hoh J, Perls TT (18 de enero 2012). "Firmas genéticas de excepcional longevidad en humanos" . PLOS One . 7 (1): e29848. Código bibliográfico : 2012PLoSO ... 729848S . doi : 10.1371 / journal.pone.0029848 . PMC 3261167 . PMID 22279548 .
- ^ Visscher PM, Brown MA, McCarthy MI, Yang J (enero de 2012). "Cinco años de descubrimiento de GWAS" . Revista Estadounidense de Genética Humana . 90 (1): 7–24. doi : 10.1016 / j.ajhg.2011.11.029 . PMC 3257326 . PMID 22243964 .
- ^ Patrón J, Serra-Cayuela A, Han B, Li C, Wishart D (julio de 2019). "Evaluación del rendimiento de estudios de asociación de todo el genoma para predecir el riesgo de enfermedad". bioRxiv 10.1101 / 701086 .
- ^ Santolini M, Romay MC, Yukhtman CL, Rau CD, Ren S, Saucerman JJ, Wang JJ, Weiss JN, Wang Y, Lusis AJ, Karma A (24 de febrero de 2018). "Un enfoque multiómico personalizado identifica los genes implicados en la hipertrofia cardíaca y la insuficiencia cardíaca" . Biología y aplicaciones de sistemas NPJ . 4 (1): 12. doi : 10.1038 / s41540-018-0046-3 . PMC 5825397 . PMID 29507758 .
- ^ Rosenberg NA, Huang L, Jewett EM, Szpiech ZA, Jankovic I, Boehnke M (mayo de 2010). "Estudios de asociación de todo el genoma en diversas poblaciones" . Nature Reviews Genética . 11 (5): 356–66. doi : 10.1038 / nrg2760 . PMC 3079573 . PMID 20395969 .
- ^ Sham PC, Cherny SS, Purcell S, Hewitt JK (mayo de 2000). "Poder de vinculación versus análisis de asociación de rasgos cuantitativos, mediante el uso de modelos de componentes de varianza, para datos de hermandad" . Revista Estadounidense de Genética Humana . 66 (5): 1616–30. doi : 10.1086 / 302891 . PMC 1378020 . PMID 10762547 .
- ^ Borecki IB (2006). "Estudios de vinculación y asociación". Enciclopedia de Ciencias de la Vida . eLS . John Wiley & Sons, Ltd. doi : 10.1038 / npg.els.0005483 . ISBN 9780470015902.
- ^ Visscher PM, Goddard ME , Derks EM, Wray NR (mayo de 2012). "Genética psiquiátrica basada en evidencias, también conocida como la falsa dicotomía entre hipótesis variantes comunes y raras" . Psiquiatría molecular . 17 (5): 474–85. doi : 10.1038 / mp.2011.65 . PMID 21670730 .
enlaces externos
- Bases de datos y herramientas de software de interacción genotipo-fenotipo en omicX
- Métodos estadísticos para el análisis de estudios de asociación en todo el genoma [serie de conferencias en vídeo]
- Estudios de asociación del genoma completo - por el Instituto Nacional de Investigación del Genoma Humano
- GWAS Central : una base de datos central de hallazgos de asociación genética a nivel de resumen
- Barrett, Jeff (18 de julio de 2010). "Cómo leer un estudio de asociación de todo el genoma" . Genomas descomprimidos.
- Consorcios de estudios de asociación de genoma completo (GWAS) - por Bennett SN, Caporaso, NE, et al.
- PLINK : conjunto de herramientas de análisis de asociación del genoma completo
- Explorador de subprocesos ENCODE Impacto de la información funcional en la comprensión de la variación. Naturaleza (diario)