Pangenoma


En los campos de la biología molecular y la genética , un pangenoma ( pangenoma o supragenome ) es el entero conjunto de genes de todas las cepas dentro de un clado . De manera más general, es la unión de todos los genomas de un clado . [2] [3] [4] [5] El pangenoma se puede descomponer en un "pangenoma central" que contiene genes presentes en todos los individuos, un "pangenoma de caparazón" que contiene genes presentes en dos o más cepas, y un "pangenoma de nube" que contiene genes que solo se encuentran en una única cepa. [3] [4][6] Algunos autores también se refieren al genoma de la nube como "genoma accesorio" que contiene genes "prescindibles" presentes en un subconjunto de las cepas y genes específicos de la cepa. [2] [3] [4] Nótese que el uso del término 'prescindible' ha sido cuestionado, al menos en genomas de plantas, ya que los genes accesorios juegan "un papel importante en la evolución del genoma y en la interacción compleja entre el genoma y el ambiente". [5] El campo de estudio del pangenoma se llama pangenómica . [2]

El repertorio genético de una especie bacteriana es mucho mayor que el contenido genético de una cepa individual. [7] Algunas especies tienen pangenomas abiertos (o extensos), mientras que otras tienen pangenomas cerrados. [2] Para las especies con un pangenoma cerrado, se agregan muy pocos genes por genoma secuenciado (después de secuenciar muchas cepas), y el tamaño del pangenoma completo puede predecirse teóricamente. Las especies con un pangenoma abierto tienen suficientes genes agregados por genoma secuenciado adicional que es imposible predecir el tamaño del pangenoma completo. [4] Se ha sugerido que el tamaño de la población y la versatilidad del nicho son los factores más influyentes para determinar el tamaño del pangenoma. [2]

Los pangenomas se construyeron originalmente para especies de bacterias y arqueas , pero más recientemente se han desarrollado pangenomas eucariotas , particularmente para especies de plantas . Los estudios de plantas han demostrado que la dinámica del pangenoma está relacionada con elementos transponibles. [8] [9] [10] [11] La importancia del pangenoma surge en un contexto evolutivo, especialmente con relevancia para la metagenómica , [12] pero también se utiliza en un contexto genómico más amplio. [13]En la primavera de 2020 se publicó un libro de acceso abierto que revisa el concepto de pangenoma y sus implicaciones, editado por Tettelin y Medini. [14]

El término "pangenoma" fue definido con su significado actual por Tettelin et al. en 2005; [2] deriva 'pan' de la palabra griega παν , que significa 'todo' o 'todo', mientras que el genoma es un término de uso común para describir el material genético completo de un organismo. Tettelin y col. aplicó el término específicamente a las bacterias , cuyo pangenoma "incluye un genoma central que contiene genes presentes en todas las cepas y un genoma prescindible compuesto por genes ausentes de una o más cepas y genes que son únicos para cada cepa". [2]

Es la parte del pangenoma que comparten todos los genomas del conjunto probado. Algunos autores han dividido el pangenoma central en núcleo duro, aquellas familias de genes homólogos que tienen al menos una copia de la familia compartida por cada genoma (100% de los genomas) y el núcleo blando o núcleo extendido, [15] aquellas familias distribuidas arriba un cierto umbral (90%). En un estudio que involucra los pangenomas de Bacillus cereus y Staphylococcus aureus , algunos de ellos aislados de la estación espacial internacional, los umbrales utilizados para segmentar los pangenomas fueron los siguientes: "Nube", "Concha" y "Núcleo" correspondientes al gen familias con presencia en <10%, 10 a 95% y> 95% de los genomas, respectivamente.[dieciséis]


Análisis de pangenoma de los genomas de Streptococcus agalactiae realizado con el software Anvi'o [1] cuyo desarrollo está dirigido por A. Murat Eren . Genomas obtenidos de Tettelin et al (2005). [2] Cada círculo corresponde a un genoma y cada radio representa una familia de genes. En la parte inferior y a la derecha se localizan las familias de genomas centrales. Algunas familias en el núcleo pueden tener más de un gen homólogo por genoma. En el medio, a la izquierda de la figura, se observa el genoma del caparazón. En la parte superior izquierda se muestran familias del genoma prescindible y singletons.
En el pangenoma, podemos identificar tres conjuntos de genes: genoma Core, Shell y Cloud. El genoma central comprende los genes que están presentes en todos los genomas analizados. Para evitar descartar familias debido a artefactos de secuenciación, algunos autores consideran el softcore (> 95% de ocurrencia). El genoma de Shell consta de genes compartidos por la mayoría de los genomas (ocurrencia del 10 al 95%). Las familias de genes presentes en un solo genoma o <10% de ocurrencia se describen como genoma dispensable o de nube.
a) Los pangenomas cerrados se caracterizan por genomas centrales grandes y genomas accesorios pequeños. b) Los pangenomas abiertos tienden a tener genomas centrales pequeños y genomas accesorios grandes. c) El tamaño de los pangenomas abiertos tiende a aumentar con cada genoma agregado, mientras que el tamaño del pangenoma cerrado tiende a ser asintótico a pesar de agregar más genomas. Debido a esta característica, se puede predecir el tamaño completo del pangenoma para los pangenomas cerrados.
El supergenoma se define como todos los genes accesibles para una determinada especie, el pangenoma si estuviera disponible la secuenciación de todos los genomas de una especie. El metapangenoma es el análisis de pangenoma aplicado a muestras metagenómicas, donde se evalúa la unión de genes de varias especies para un hábitat determinado.
El pangenoma de S. pneumoniae . (a) Número de genes nuevos en función del número de genomas secuenciados. El número previsto de nuevos genes desciende bruscamente a cero cuando el número de genomas supera los 50. (b) Número de genes centrales en función del número de genomas secuenciados. El número de genes centrales converge a 1647 para el número de genomas n → ∞. De Donati et al. [36]
Análisis de pangenoma de genomas de Streptococcus agalactiae . [2] Ejemplo de filogenias realizadas con software BPGA. Este software nos permite generar filogenias basadas en la agrupación del genoma central o pangenoma. Las reconstrucciones del núcleo y panfilogenéticas no coinciden necesariamente.
Ejemplo de posibles salidas del software BPGA. Análisis de pangenoma de genomas de Streptococcus agalactiae . A la izquierda, se muestra la distribución de los términos de Go por genoma central / prescindible / único. En este ejemplo, las categorías de replicación, recombinación y reparación se enriquecen en familias de genes únicas. A la derecha, se muestra un gráfico pan / núcleo típico, cuando se han agregado más genomas, el tamaño del núcleo disminuye y, por el contrario, aumenta el tamaño del pangenoma. [2]