Un supertárbol es un árbol filogenético único ensamblado a partir de una combinación de árboles filogenéticos más pequeños, que pueden haberse ensamblado utilizando diferentes conjuntos de datos (por ejemplo, morfológicos y moleculares) o una selección diferente de taxones. [1] Los algoritmos de superárbol pueden resaltar áreas donde los datos adicionales resolverían de manera más útil cualquier ambigüedad. [2] Los árboles de entrada de un superárbol deberían comportarse como muestras del árbol más grande. [3]
Métodos de construcción
La construcción de un superárbol escala exponencialmente con el número de impuestos incluidos; por lo tanto, para un árbol de cualquier tamaño razonable, no es posible examinar todos los superárboles posibles y sopesar su éxito al combinar la información de entrada. Por tanto, los métodos heurísticos son esenciales, aunque estos métodos pueden no ser fiables; el resultado extraído suele estar sesgado o afectado por características irrelevantes de los datos de entrada. [1]
El método más conocido para la construcción de supertárbol es Representación de matrices con parsimonia (MRP), en el que los árboles de origen de entrada están representados por matrices con 0, 1 y? S (es decir, cada borde de cada árbol de origen define una bipartición del conjunto de hojas en dos partes disjuntas, y las hojas de un lado obtienen 0, las hojas del otro lado obtienen 1 y las hojas faltantes obtienen?), y las matrices se concatenan y luego se analizan utilizando heurísticas para obtener la máxima parsimonia. [4] Otro enfoque para la construcción de supertárbol incluye una versión de máxima verosimilitud de MRP llamada "MRL" (representación matricial con verosimilitud), que analiza la misma matriz de MRP pero utiliza heurísticas para la máxima probabilidad en lugar de la máxima parsimonia para construir el supertárbol.
La distancia de Robinson-Foulds es la más popular de muchas formas de medir qué tan similar es un supertárbol a los árboles de entrada. Es una métrica para el número de clados de los árboles de entrada que se retienen en el superárbol. Los métodos de optimización de Robinson-Foulds buscan un superárbol que minimice las diferencias totales (sumadas) de Robinson-Foulds entre el superárbol (binario) y cada árbol de entrada. [1]
Una innovación reciente ha sido la construcción de supertárboles de máxima verosimilitud y el uso de puntajes de verosimilitud "en forma de árbol de entrada" para realizar pruebas de dos supertárboles. [5]
Los métodos adicionales incluyen el enfoque Min Cut Supertree, [6] Most Similar Supertree Analysis (MSSA), Distance Fit (DFIT) y Quartet Fit (QFIT), implementados en el software CLANN. [7] [8]
Solicitud
Se han aplicado superárboles para producir filogenias de muchos grupos, en particular las angiospermas , [9] eucariotas [10] y mamíferos. [11] También se han aplicado a problemas de mayor escala como los orígenes de la diversidad, la vulnerabilidad a la extinción [12] y los modelos evolutivos de estructura ecológica. [13]
Otras lecturas
- Bininda-Emonds, OR P (2004). Supertárboles filogenéticos: combinar información para revelar el árbol de la vida . ISBN 978-1-4020-2328-6.
- Bininda-Emonds, ORP; Gittleman, JL; Acero, MA (2002). "El (super) árbol de la vida: procedimientos, problemas y perspectivas". Revisión anual de ecología y sistemática . 33 : 265-289. doi : 10.1146 / annurev.ecolsys.33.010802.150511 . JSTOR 3069263 .
Referencias
- ^ a b c Bansal, M .; Burleigh, J .; Eulenstein, O .; Fernández-Baca, D. (2010). "Superárboles de Robinson-Foulds" . Algoritmos de Biología Molecular . 5 : 18. doi : 10.1186 / 1748-7188-5-18 . PMC 2846952 . PMID 20181274 .
- ^ "Supertree: Introducción" . genome.cs.iastate.edu.
- ^ Gordon, A. (1986). "Superárboles de consenso: la síntesis de árboles enraizados que contienen conjuntos superpuestos de hojas etiquetadas". Revista de clasificación . 3 (2): 335–348. doi : 10.1007 / BF01894195 .
- ^ Mark A. Ragan (1992). "Inferencia filogenética basada en la representación matricial de árboles". Filogenética molecular y evolución . 1 (1): 53–58. doi : 10.1016 / 1055-7903 (92) 90035-F . ISSN 1055-7903 . PMID 1342924 .
- ^ Akanni, Wasiu A .; Creevey, Christopher J .; Wilkinson, Mark; Pisani, Davide (12 de junio de 2014). "LUSt: una herramienta para la reconstrucción de superárboles de máxima verosimilitud aproximada" . BMC Bioinformática . 15 (1): 183. doi : 10.1186 / 1471-2105-15-183 . ISSN 1471-2105 . PMC 4073192 . PMID 24925766 .
- ^ Semple, C. (2000). "Un método de superárbol para árboles enraizados". Matemáticas aplicadas discretas . 105 (1-3): 147-158. doi : 10.1016 / S0166-218X (00) 00202-X .
- ^ Creevey, CJ; McInerney, JO (1 de febrero de 2005). "Clann: investigando información filogenética a través de análisis de superárboles" . Bioinformática . 21 (3): 390–392. doi : 10.1093 / bioinformatics / bti020 . ISSN 1367-4803 . PMID 15374874 .
- ^ Creevey, CJ; McInerney, JO (1 de enero de 2009). "Árboles de árboles: construcción de superárboles filogenéticos utilizando Clann" (PDF) . En Posada, David (ed.). Árboles a partir de árboles: construcción de superárboles filogenéticos utilizando Clann - Springer . Métodos en Biología Molecular. 537 . Prensa Humana. págs. 139-161. doi : 10.1007 / 978-1-59745-251-9_7 . ISBN 978-1-58829-910-9. PMID 19378143 .
- ^ Davies, T .; Barraclough, T .; Chase, M .; Soltis, P .; Soltis, D .; Savolainen, V. (2004). "Misterio abominable de Darwin: conocimientos de un superárbol de las angiospermas" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 101 (7): 1904-1909. Código Bibliográfico : 2004PNAS..101.1904D . doi : 10.1073 / pnas.0308127100 . PMC 357025 . PMID 14766971 .
- ^ Pisani, D .; Algodón, J .; McInerney, J. (2007). "Los superárboles desenredan el origen quimérico de los genomas eucariotas" . Biología Molecular y Evolución . 24 (8): 1752-1760. doi : 10.1093 / molbev / msm095 . PMID 17504772 .
- ^ Bininda-Emonds, O .; Cardillo, M .; Jones, K .; MacPhee, R .; Beck, R .; Grenyer, R .; Precios.; Vos, R .; Gittleman, J .; Purvis, A. (2007). "El retraso en el surgimiento de los mamíferos actuales". Naturaleza . 446 (7135): 507–512. Código Bibliográfico : 2007Natur.446..507B . doi : 10.1038 / nature05634 . PMID 17392779 .
- ^ Davies, T .; Fritz, S .; Grenyer, R .; Orme, C .; Bielby, J .; Bininda-Emonds, O .; Cardillo, M .; Jones, K .; Gittleman, J .; Mace, GM; Purvis, A. (2008). "Árboles filogenéticos y el futuro de la biodiversidad de mamíferos" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 105 Suppl 1 (Suplemento_1): 11556–11563. Código Bibliográfico : 2008PNAS..10511556D . doi : 10.1073 / pnas.0801917105 . PMC 2556418 . PMID 18695230 .
- ^ Webb, CO; Ackerly, DD; McPeek, MA; Donoghue, MJ (2002). "Filogenias y Ecología Comunitaria". Revisión anual de ecología y sistemática . 33 : 475–505. doi : 10.1146 / annurev.ecolsys.33.010802.150448 .