MEGAN ("MEtaGenome ANalyzer") es un programa informático que permite el análisis optimizado de grandes conjuntos de datos metagenómicos . [1] [2]
Desarrollador (es) | Daniel Huson y col. |
---|---|
Lanzamiento estable | 6.13.1 / 2017 |
Escrito en | Java |
Sistema operativo | Windows, Unix, Linux, Mac OS X |
Tipo | Bioinformática |
Licencia | "Edición comunitaria" de código abierto gratuito, "Edición definitiva" comercial con licencia de Computomics |
Sitio web | https://uni-tuebingen.de/fakultaeten/mathematisch-naturwissenschaftliche-fakultaet/fachbereiche/informatik/lehrstuehle/algorithms-in-bioinformatics/software/megan6/ |
La metagenómica es el análisis de las secuencias genómicas de una muestra ambiental generalmente no cultivada . Un objetivo a largo plazo de la mayoría de la metagenómica es inventariar y medir la extensión y el papel de la biodiversidad microbiana en el ecosistema debido a los descubrimientos de que la diversidad de organismos microbianos y agentes virales en el medio ambiente es mucho mayor de lo estimado previamente. [3] Las herramientas que permiten la investigación de conjuntos de datos muy grandes de muestras ambientales utilizando técnicas de secuenciación de escopeta en particular, como MEGAN, están diseñadas para muestrear e investigar la biodiversidad desconocida de muestras ambientales donde se utilizan técnicas más precisas con muestras más pequeñas y más conocidas, No puede ser usado.
Los fragmentos de ADN de una muestra metagenómica, como las aguas del océano o el suelo, se comparan con bases de datos de secuencias de ADN conocidas utilizando BLAST u otra herramienta de comparación de secuencias para ensamblar los segmentos en secuencias comparables discretas. A continuación, se usa MEGAN para comparar las secuencias resultantes con las secuencias de genes de GenBank en NCBI . [4] El programa se utilizó para investigar el ADN de un mamut recuperado del permafrost siberiano [5] y del conjunto de datos del Mar de los Sargazos. [6]
Introducción
La metagenómica es el estudio del contenido genómico de muestras del mismo hábitat, que está diseñado para determinar el papel y el alcance de la diversidad de especies. La secuenciación dirigida o aleatoria se usa ampliamente con comparaciones con bases de datos de secuencias. [1] Los desarrollos recientes en la tecnología de secuenciación aumentaron el número de muestras metagenómicas. MEGAN es una herramienta fácil de usar para analizar dichos datos metagenómicos. La primera versión de MEGAN se lanzó en 2007 [1] y la versión más reciente es MEGAN6 . [7] La primera versión es capaz de analizar el contenido taxonómico de un solo conjunto de datos, mientras que la última versión puede analizar múltiples conjuntos de datos, incluidas nuevas características (consultar diferentes bases de datos, nuevo algoritmo, etc.).
Oleoducto MEGAN
El análisis de MEGAN comienza con la recopilación de lecturas de cualquier plataforma de escopeta. Luego, las lecturas se comparan con bases de datos de secuencias usando BLAST o similar. En tercer lugar, MEGAN asigna un ID de taxón a los resultados de lectura procesados en función de la taxonomía NCBI que crea un archivo MEGAN que contiene la información necesaria para el análisis estadístico y gráfico. Por último, el algoritmo del ancestro común más bajo ( LCA ) se puede ejecutar para inspeccionar asignaciones, analizar datos y crear resúmenes de datos basados en diferentes niveles de taxonomía NCBI. El algoritmo LCA simplemente encuentra el ancestro común más bajo de diferentes especies. [1] [2]
Cómo usar MEGAN
La última versión de MEGAN se puede descargar aquí. [8] Está disponible en plataformas Windows, MAC y Unix. La edición Community es de código abierto y de uso gratuito, la edición Ultimate con soporte de línea de comandos tiene licencia de Computomics .
MEGAN se puede utilizar para explorar la diversificación taxonómica del conjunto de datos que podría recopilarse de cualquier tipo de proyecto metagenómico o plataforma de secuenciación. En la etapa de preprocesamiento, el conjunto de lecturas de ADN se compara con bases de datos de secuencias que pueden ser computacionalmente exhaustivas y computacionalmente complejas para un usuario estándar. MEGAN facilita esta tarea y los análisis de datos se pueden realizar en una estación de trabajo después de completar la comparación de secuencias en un grupo de computadoras. Además de eso, es posible el análisis funcional usando SEED , el análisis funcional usando KEGG y el análisis funcional usando COG / EGGNOG . El análisis de coordenadas principales ( PCoA ) también está disponible en la última versión para taxonomía y perfiles funcionales. Las opciones de visualización comparativa también proporcionan una funcionalidad adicional para mostrar y presentar datos. [9]
Referencias
- ^ a b c d Huson, H .; A. Auch; Ji Qi; SC Schuster (2007). "Análisis MEGAN de datos metagenómicos" . Investigación del genoma . 17 (3): 377–386. doi : 10.1101 / gr.5969107 . PMC 1800929 . PMID 17255551 . Consultado el 3 de abril de 2008 .
- ^ a b Huson, Daniel H; S. Mitra; N. Weber; H. Ruscheweyh; Stephan C. Schuster (2011). "Análisis integrativo de secuencias ambientales utilizando MEGAN4" . Investigación del genoma . 21 (9): 1552-1560. doi : 10.1101 / gr.120618.111 . PMC 3166839 . PMID 21690186 .
- ^ Nee, S. (2004). "Más de lo que parece". Naturaleza . 429 (6994): 804–805. Código bibliográfico : 2004Natur.429..804N . doi : 10.1038 / 429804a . PMID 15215837 . S2CID 1699973 .
- ^ Frias-Lopez, Jorge; Yanmei Shi; Gene W. Tyson; Maureen L. Coleman; Stephan C. Schuster; Sallie W. Chisholm; banda Edward F. DeLong (11 de marzo de 2008). "Expresión de genes de la comunidad microbiana en aguas superficiales del océano" (PDF) . PNAS . 105 (10): 3805–3810. doi : 10.1073 / pnas.0708897105 . PMC 2268829 . PMID 18316740 . Consultado el 3 de abril de 2008 .
- ^ Poinar, Hendrik N .; Carsten Schwarz; Ji Qi; Beth Shapiro; Ross DE MacPhee; Bernard Buigues; Alexei Tikhonov; Daniel Huson; Lynn P. Tomsho; Alexander Auch; Markus Rampp; Webb Miller; Stephan C. Schuster (2007). "Metagenómica a la paleogenómica: secuenciación a gran escala del ADN de mamut" . Ciencia . 331 (6016): 392–394. doi : 10.1126 / science.331.6016.392 . PMID 21273464 . Consultado el 3 de abril de 2008 .
- ^ Venter JC, Remington K, Heidelberg JF, Halpern AL, Rusch D, Eisen JA, Wu D, Paulsen I, Nelson KE, Nelson W, Fouts DE, Levy S, Knap AH, Lomas MW, Nealson K, White O, Peterson J , Hoffman J, Parsons R, Baden-Tillson H, Pfannkoch C, Rogers YH, Smith HO (abril de 2004). "Secuenciación de escopeta del genoma ambiental del mar de los Sargazos". Ciencia . 304 (5667): 66–74. Código Bibliográfico : 2004Sci ... 304 ... 66V . CiteSeerX 10.1.1.124.1840 . doi : 10.1126 / science.1093857 . PMID 15001713 . S2CID 1454587 .
- ^ "MEGAN6 - Algoritmos en Bioinformática" . uni-tuebingen.de . Consultado el 21 de diciembre de 2020 .Huson, Daniel H; S. Beier; I. Flade; A. Gorska; M. El-Hadidi; H. Ruscheweyh; R. Tappu (2016). "MEGAN Community Edition - Exploración interactiva y análisis de datos de secuenciación de microbiomas a gran escala" . PLOS Biología Computacional . 12 (6): e1004957. Código bibliográfico : 2016PLSCB..12E4957H . doi : 10.1371 / journal.pcbi.1004957 . PMC 4915700 . PMID 27327495 .
- ^ "MEGAN6-descargar" . software-ab.inf.uni-tuebingen.de . Consultado el 21 de diciembre de 2020 .
- ^ "MEGAN6 - Algoritmos en Bioinformática" . ab.inf.uni-tuebingen.de . Consultado el 12 de junio de 2016 .Huson, Daniel H; S. Beier; I. Flade; A. Gorska; M. El-Hadidi; H. Ruscheweyh; R. Tappu (2016). "MEGAN Community Edition - Exploración interactiva y análisis de datos de secuenciación de microbiomas a gran escala" . PLOS Biología Computacional . 12 (6): e1004957. Código bibliográfico : 2016PLSCB..12E4957H . doi : 10.1371 / journal.pcbi.1004957 . PMC 4915700 . PMID 27327495 .