T-REX (servidor web)

Este artículo puede ser demasiado técnico para que la mayoría de los lectores lo comprendan . Ayude a mejorarlo para que sea comprensible para los no expertos , sin eliminar los detalles técnicos. ( Octubre de 2012 ) ( Obtenga información sobre cómo y cuándo eliminar este mensaje de plantilla )

T-REX ( sitio web ) (Reconstrucción de árboles y reticulogramas) ^[1]^[2] es un servidor web de libre acceso , desarrollado en el departamento de Ciencias de la Computación de la Université du Québec à Montréal , dedicado a la inferencia, validación y visualización de árboles filogenéticos y redes filogenéticas . El servidor web T-REX ^[1]^[2] permite a los usuarios realizar varios métodos populares de análisis filogenético, así como algunas aplicaciones filogenéticas nuevas para inferir, dibujar y validar árboles y redes filogenéticas.

Inferencia filogenética

Los siguientes métodos para inferir y validar árboles filogenéticos usando distancias están disponibles: Unión de vecinos (NJ), Unión de vecinos a gran escala NINJA , BioNJ , UNJ, ADDTREE, MW, FITCH y reconstrucción de orden circular. Para la máxima parsimonia: DNAPARS, PROTPARS, PARS y DOLLOP, todos ellos del paquete PHYLIP , y para la máxima verosimilitud: PhyML, ^[3] RAxML, ^[4] DNAML, DNAMLK, PROML y PROMLK, los cuatro últimos métodos son del paquete PHYLIP , están disponibles.

Dibujo de arbol

Hay disponibles tipos jerárquicos de dibujo de árbol vertical, horizontal, radial y axial.

Los datos de entrada pueden estar en los tres formatos siguientes: formato Newick , formato PHYLIP y FASTA . Todos los resultados gráficos proporcionados por el servidor T-REX pueden guardarse en formato SVG (Scalable Vector Graphics) y luego abrirse y modificarse (por ejemplo, preparados para una publicación o presentación) en el editor de gráficos preferido del usuario.

Construcción de árboles

Una aplicación desarrollada para dibujar árboles filogenéticos que permite guardarlos en formato Newick .

Inferencia de árbol a partir de matrices incompletas

Se encuentran disponibles los siguientes métodos para reconstruir árboles filogenéticos a partir de una matriz de distancia que contiene valores perdidos, es decir, matrices incompletas: método de triángulos de Guénoche y Leclerc (2001), procedimiento ultramétrico para la estimación de valores perdidos de Landry, Lapointe y Kirsch (1996) seguido de NJ, procedimiento aditivo para la estimación de valores perdidos de Landry, Lapointe y Kirsch (1996) seguido de NJ, y el método de mínimos cuadrados ponderados modificados (MW *) de Makarenkov y Lapointe (2004). El método MW * asigna la ponderación de 1 a las entradas existentes, la ponderación de 0,5 a las entradas estimadas y la ponderación de 0 cuando la estimación de la entrada era imposible. Las simulaciones descritas en (Makarenkov y Lapointe 2004) mostraron que el método MW * supera claramente a los procedimientos Triángulos, Ultramétrico y Aditivo.

Detección de transferencia de genes horizontal

Los métodos completos y parciales de detección y validación de la transferencia de genes horizontal se incluyen en el servidor T-REX. El programa HGT-Detection ^[5] tiene como objetivo determinar un escenario óptimo, es decir, de costo mínimo, de transferencias de genes horizontales mientras se procede a una reconciliación gradual de las especies y árboles genéticos dados.

Inferencia de reticulograma

El reticulograma, es decir, el programa de reconstrucción de redes reticuladas, primero construye un árbol filogenético de soporte utilizando uno de los métodos de inferencia de árboles existentes. Después de esto, una rama de reticulación que minimiza la función objetivo de mínimos cuadrados o mínimos cuadrados ponderados se agrega al árbol (o red a partir del Paso 2) en cada paso del algoritmo. ^[6] Se han propuesto dos criterios estadísticos, Q1 y Q2, para medir la ganancia de ajuste proporcionada por cada rama de reticulación.

La versión del servidor web de T-REX también ofrece la posibilidad de inferir el árbol de soporte a partir de una matriz de distancia y luego agregar ramas de reticulación utilizando otra matriz de distancia. Tal algoritmo puede ser útil para representar similitudes morfológicas o genéticas entre especies dadas o para identificar eventos HGT usando la primera matriz de distancia para inferir el árbol de especies y la segunda matriz (que contiene las distancias relacionadas con el gen) para inferir las ramas de reticulación que representan supuestos transferencias horizontales de genes ^[6] . ^[7]

Alineación de secuencia

MAFFT , MUSCLE (software de alineación) y ClustalW , que se encuentran entre las herramientas de alineación de secuencias múltiples más utilizadas , están disponibles con opciones de alineación por pares lenta y rápida.

Modelos de sustitución (transformación de secuencia a distancia)

Los siguientes modelos populares de sustitución de la evolución del ADN y los aminoácidos, que permiten estimar las distancias evolutivas a partir de los datos de la secuencia, se han incluido en T-REX: distancia sin corregir, Jukes-Cantor (Jukes y Cantor 1969), parámetros K80 - 2 (Kimura 1980) , T92 (Tamura 1992), Tajima-Nei (Tajima y Nei 1984), Jin-Nei gamma (Jin y Nei 1990), proteína Kimura (Kimura 1983), LogDet (Lockhart et al. 1994), F84 (Felsenstein 1981), WAG (Whelan y Goldman 2001), JTT (Jones et al. 1992) y LG (Le y Gascuel 2008).

Distancia topológica de Robinson y Foulds

Este programa calcula la distancia topológica métrica de Robinson-Foulds (RF) (Robinson y Foulds 1981), que es una medida popular de la similitud de los árboles, entre el primer árbol y todos los árboles siguientes especificados por el usuario. Los árboles se pueden suministrar en formato newick o matricial de distancias. Se lleva a cabo un algoritmo óptimo descrito en (Makarenkov y Leclerc 2000) para calcular la métrica de RF.

Conversión de Newick a Matrix

Conversión de formato Newick a Matriz de distancia y Matriz de distancia a Newick. Una aplicación interna permite al usuario convertir un árbol filogenético del formato Newick al formato de matriz de distancia y viceversa.

Generador de árbol aleatorio

Esta aplicación genera k árboles filogenéticos aleatorios con n hojas, es decir, especies o taxones, y una longitud de rama promedio l utilizando el procedimiento de generación de árboles aleatorios descrito por Kuhner y Felsenstein (1994), ^[8] donde se definen las variables k , n y l por el usuario. Las longitudes de las ramas de los árboles siguen una distribución exponencial. Las longitudes de las ramas se multiplican por 1+ ax , donde la variable x se obtiene de una distribución exponencial (P ( x > k ) = exp (- k)), y la constante a es un factor de ajuste que representa la intensidad de la desviación (como se describe en Guindon y Gascuel (2002), ^[9] el valor de a se estableció en 0,8). Los árboles aleatorios generados por este procedimiento tienen una profundidad de O (log ( n )).

Referencias

↑ a b Boc A, Diallo Alpha B, Makarenkov V (junio de 2012). "T-REX: un servidor web para inferir, validar y visualizar árboles y redes filogenéticas" . Ácidos nucleicos Res . 40 (Problema del servidor web): W573 – W579. doi : 10.1093 / nar / gks485 . PMC 3394261 . PMID 22675075 .
↑ a b Makarenkov V (julio de 2001). "T-REX: Reconstruyendo y visualizando árboles filogenéticos y redes de reticulación" . Bioinformática . 17 (7): 664–668. doi : 10.1093 / bioinformatics / 17.7.664 . PMID 11448889 .
^ Guindon S, Delsuc F, Dufayard JF, Gascuel O (2009). Estimación de filogenias de máxima verosimilitud con PhyML . Métodos en Biología Molecular. 537 . Prensa Humana. págs. 113-137. CiteSeerX 10.1.1.464.7907 . doi : 10.1007 / 978-1-59745-251-9_6 . ISBN 978-1-58829-910-9. PMID 19378142 .
^ Stamatakis A. (agosto de 2006). "RAxML-VI-HPC: análisis filogenéticos basados en máxima verosimilitud con miles de taxones y modelos mixtos" . Bioinformática . 22 (21): 2688–2690. doi : 10.1093 / bioinformatics / btl446 . PMID 16928733 .
^ Boc A, Philippe H, Makarenkov V (enero de 2010). "Inferir y validar eventos de transferencia de genes horizontal utilizando disimilitud de bipartición" . Syst. Biol . 59 (2): 195–211. doi : 10.1093 / sysbio / syp103 . PMID 20525630 .
↑ a b Legendre P, Makarenkov V (abril de 2002). "Reconstrucción de redes biogeográficas y evolutivas mediante reticulogramas" . Syst. Biol . 51 (2): 199–216. doi : 10.1080 / 10635150252899725 . PMID 12028728 .
^ Makarenkov V, Legendre P (2004). "De un árbol filogenético a una red reticulada". J. Comput. Biol . 11 (1): 195–212. doi : 10.1089 / 106652704773416966 . PMID 15072696 .
^ Kuhner MK, Felsenstein J (mayo de 1994). "Una comparación de simulación de algoritmos de filogenia bajo tasas evolutivas iguales y desiguales" . Mol Biol Evol . 11 (3): 459–468. doi : 10.1093 / oxfordjournals.molbev.a040126 . PMID 8015439 .
^ Guindon S, Gascuel O (abril de 2002). "Estimación sesgada eficiente de las distancias evolutivas cuando las tasas de sustitución varían entre los sitios" . Mol Biol Evol . 19 (4): 534–43. doi : 10.1093 / oxfordjournals.molbev.a004109 . PMID 11919295 .

morir

enlaces externos

Página oficial del servidor web T-REX

[pmid22675075-1] Boc A, Diallo Alpha B, Makarenkov V (junio de 2012). "T-REX: un servidor web para inferir, validar y visualizar árboles y redes filogenéticas" . Ácidos nucleicos Res . 40 (Problema del servidor web): W573 – W579. doi : 10.1093 / nar / gks485 . PMC 3394261 . PMID 22675075 .

[pmid11448889-2] Makarenkov V (julio de 2001). "T-REX: Reconstruyendo y visualizando árboles filogenéticos y redes de reticulación" . Bioinformática . 17 (7): 664–668. doi : 10.1093 / bioinformatics / 17.7.664 . PMID 11448889 .

[pmid19378142-3] Guindon S, Delsuc F, Dufayard JF, Gascuel O (2009). Estimación de filogenias de máxima verosimilitud con PhyML . Métodos en Biología Molecular. 537 . Prensa Humana. págs. 113-137. CiteSeerX 10.1.1.464.7907 . doi : 10.1007 / 978-1-59745-251-9_6 . ISBN 978-1-58829-910-9. PMID 19378142 .

[pmid16928733-4] Stamatakis A. (agosto de 2006). "RAxML-VI-HPC: análisis filogenéticos basados en máxima verosimilitud con miles de taxones y modelos mixtos" . Bioinformática . 22 (21): 2688–2690. doi : 10.1093 / bioinformatics / btl446 . PMID 16928733 .

[pmid20525630-5] Boc A, Philippe H, Makarenkov V (enero de 2010). "Inferir y validar eventos de transferencia de genes horizontal utilizando disimilitud de bipartición" . Syst. Biol . 59 (2): 195–211. doi : 10.1093 / sysbio / syp103 . PMID 20525630 .

[pmid12028728-6] Legendre P, Makarenkov V (abril de 2002). "Reconstrucción de redes biogeográficas y evolutivas mediante reticulogramas" . Syst. Biol . 51 (2): 199–216. doi : 10.1080 / 10635150252899725 . PMID 12028728 .

[pmid15072696-7] Makarenkov V, Legendre P (2004). "De un árbol filogenético a una red reticulada". J. Comput. Biol . 11 (1): 195–212. doi : 10.1089 / 106652704773416966 . PMID 15072696 .

[pmid8015439-8] Kuhner MK, Felsenstein J (mayo de 1994). "Una comparación de simulación de algoritmos de filogenia bajo tasas evolutivas iguales y desiguales" . Mol Biol Evol . 11 (3): 459–468. doi : 10.1093 / oxfordjournals.molbev.a040126 . PMID 8015439 .

[pmid11919295-9] Guindon S, Gascuel O (abril de 2002). "Estimación sesgada eficiente de las distancias evolutivas cuando las tasas de sustitución varían entre los sitios" . Mol Biol Evol . 19 (4): 534–43. doi : 10.1093 / oxfordjournals.molbev.a004109 . PMID 11919295 .

[1]