PLINK [1] es un conjunto de herramientas de análisis de asociación de genoma completo de código abierto, de uso común y gratuito, diseñado por Shaun Purcell . El software está diseñado de forma flexible para realizar una amplia gama de análisis genéticos básicos a gran escala.
PLINK actualmente admite las siguientes funcionalidades:
- gestión de datos;
- estadística básica ( F ST , datos faltantes, pruebas de equilibrio de Hardy-Weinberg , coeficiente de consanguinidad , etc.);
- Cálculo del desequilibrio de ligamiento (LD);
- Cálculo de la matriz de identidad por descendencia (IBD) e identidad por estado (IBS);
- estratificación de la población , como un análisis de componentes principales ;
- análisis de asociación, como el estudio de asociación de todo el genoma, tanto para estudios básicos de casos / controles como para rasgos cuantitativos;
- pruebas de epistasis
Archivos de entrada y salida
PLINK tiene su propio formato de archivos de texto (.ped) y archivos de texto binarios (.bed) que sirven como archivos de entrada para la mayoría de los análisis. Un .map acompaña a un archivo .ped y proporciona información sobre variantes, mientras que los archivos .bim y .fam acompañan a los archivos .bed como parte del conjunto de datos binarios. Además, PLINK acepta entradas de archivos VCF , BCF, Oxford y 23andMe, que normalmente se extraen en el formato binario .bed antes de realizar los análisis deseados. Con ciertos formatos como VCF, se descartará cierta información como fase y dosis.
PLINK tiene una variedad de archivos de salida según el análisis. PLINK tiene la capacidad de generar archivos para BEAGLE y puede recodificar un archivo .bed en un VCF para analizarlo en otros programas. Además, PLINK está diseñado para funcionar junto con R y puede generar archivos para que sean procesados por ciertos paquetes de R.
Ampliaciones y novedades actuales
- PLINK 2.0 una actualización integral de PLINK, desarrollada por Christopher Chang, con la velocidad mejorada de varios cálculos de asociación de todo el genoma (GWA), incluido el cálculo de la matriz de identidad por estado (IBS), la poda basada en LD y el análisis de asociación. [2]
- PLINK / SEQ es una biblioteca C / C ++ de código abierto diseñada para analizar estudios de genoma completo y exoma completo a gran escala.
- MQFAM es una prueba de asociación multivariante (MQFAM) que se puede aplicar de manera eficiente a grandes muestras de población y se implementa en PLINK.
Referencias
- ^ Purcell S; Neale B; Todd-Brown K; Thomas L; Ferreira MAR; Bender D; Maller J; Sklar P; de Bakker PIW; Daly MJ; Sham PC (2007). "PLINK: un conjunto de herramientas para la asociación de todo el genoma y análisis de vinculación basado en la población" . Revista Estadounidense de Genética Humana . 81 (3): 559–75. doi : 10.1086 / 519795 . PMC 1950838 . PMID 17701901 .
- ^ Lee, James J .; Purcell, Shaun M .; Vattikuti, Shashaank; Tellier, Laurent CAM; Chow, Carson C .; Chang, Christopher C. (1 de diciembre de 2015). "PLINK de segunda generación: a la altura del desafío de conjuntos de datos más grandes y ricos" . GigaScience . 4 (1): 7. doi : 10.1186 / s13742-015-0047-8 . PMC 4342193 . PMID 25722852 .