La secuenciación del genoma completo ( WGS ), también conocida como secuenciación del genoma completo , secuenciación del genoma completo o secuenciación del genoma completo , es el proceso de determinar la totalidad, o casi la totalidad, de la secuencia de ADN del genoma de un organismo en un solo momento. [2] Esto implica secuenciar todo el ADN cromosómico de un organismo, así como el ADN contenido en las mitocondrias y, para las plantas, en el cloroplasto .
La secuenciación del genoma completo se ha utilizado en gran medida como una herramienta de investigación, pero se introdujo en las clínicas en 2014. [3] [4] [5] En el futuro de la medicina personalizada , los datos de la secuencia del genoma completo pueden ser una herramienta importante para guiar la intervención terapéutica. . [6] La herramienta de secuenciación de genes a nivel de SNP también se utiliza para identificar variantes funcionales de estudios de asociación y mejorar el conocimiento disponible para los investigadores interesados en la biología evolutiva y, por lo tanto, puede sentar las bases para predecir la susceptibilidad a enfermedades y la respuesta a fármacos.
La secuenciación del genoma completo no debe confundirse con el perfil de ADN , que solo determina la probabilidad de que el material genético provenga de un individuo o grupo en particular, y no contiene información adicional sobre las relaciones genéticas, el origen o la susceptibilidad a enfermedades específicas. [7] Además, la secuenciación del genoma completo no debe confundirse con los métodos que secuencian subconjuntos específicos del genoma; tales métodos incluyen la secuenciación del exoma completo (1-2 % del genoma) o la determinación del genotipo SNP (<0,1 % del genoma).
Los métodos de secuenciación de ADN utilizados en las décadas de 1970 y 1980 eran manuales, por ejemplo , la secuenciación de Maxam-Gilbert y la secuenciación de Sanger . Mediante estas técnicas se secuenciaron varios genomas completos de bacteriófagos y virus animales, pero el cambio a métodos de secuenciación automatizados más rápidos en la década de 1990 facilitó la secuenciación de los genomas bacterianos y eucarióticos más grandes. [9]
El primer virus en el que se secuenció su genoma completo fue el bacteriófago MS2 en 1976. [10] En 1992, el cromosoma III de la levadura fue el primer cromosoma de cualquier organismo en ser completamente secuenciado. [11] El primer organismo cuyo genoma completo se secuenció por completo fue Haemophilus influenzae en 1995. [12] Después, se secuenciaron por primera vez los genomas de otras bacterias y algunas arqueas , en gran parte debido a su pequeño tamaño genómico. H. influenzae tiene un genoma de 1.830.140 pares de bases de ADN. [12] Por el contrario, los eucariotas , tanto unicelulares como multicelulares comoLa ameba dubia y los humanos ( Homo sapiens ), respectivamente, tienen genomas mucho más grandes (ver la paradoja del valor C ). [13] Amoeba dubia tiene un genoma de 700 mil millones de pares de nucleótidos distribuidos en miles de cromosomas . [14] Los seres humanos contienen menos pares de nucleótidos (alrededor de 3200 millones en cada célula germinal ; tenga en cuenta que el tamaño exacto del genoma humano aún se está revisando) que A. dubia ; sin embargo, el tamaño de su genoma supera con creces el tamaño del genoma de las bacterias individuales. [15]
Los primeros genomas de bacterias y arqueas, incluido el de H. influenzae , se secuenciaron mediante secuenciación de escopeta . [12] En 1996 se secuenció el primer genoma eucariótico ( Saccharomyces cerevisiae ). S. cerevisiae , un organismo modelo en biología, tiene un genoma de solo alrededor de 12 millones de pares de nucleótidos , [16] y fue el primer eucariota unicelular en tener su genoma completo secuenciado. El primer eucariota multicelular , y animal , en tener su genoma completo secuenciado fue el gusano nematodo :Caenorhabditis elegans en 1998. [17] Los genomas eucarióticos se secuencian mediante varios métodos, incluida la secuenciación Shotgun de fragmentos cortos de ADN y la secuenciación de clones de ADN más grandes de bibliotecas de ADN , como cromosomas artificiales bacterianos (BAC) y cromosomas artificiales de levadura (YAC). [18]