Un árbol filogenético (también filogenia o árbol evolutivo [3] ) es un diagrama de ramificación o un árbol que muestra las relaciones evolutivas entre varias especies biológicas u otras entidades basadas en similitudes y diferencias en sus características físicas o genéticas. Toda la vida en la Tierra es parte de un solo árbol filogenético, lo que indica un ancestro común .
En un árbol filogenético enraizado , cada nodo con descendientes representa el ancestro común más reciente inferido de esos descendientes, [ cita requerida ] y las longitudes de los bordes en algunos árboles pueden interpretarse como estimaciones de tiempo. Cada nodo se denomina unidad taxonómica. Los nodos internos generalmente se denominan unidades taxonómicas hipotéticas, ya que no pueden observarse directamente. Los árboles son útiles en campos de la biología como la bioinformática , la sistemática y la filogenia . Los árboles sin raíz ilustran solo la relación de los nodos de las hojas y no requieren que se conozca o se infiera la raíz ancestral.
Historia
La idea de un " árbol de la vida " surgió de las nociones antiguas de una progresión en forma de escalera desde las formas de vida inferiores a las superiores (como en la Gran Cadena del Ser ). Las primeras representaciones de árboles filogenéticos "ramificados" incluyen un "gráfico paleontológico" que muestra las relaciones geológicas entre plantas y animales en el libro Elementary Geology , de Edward Hitchcock (primera edición: 1840).
Charles Darwin (1859) también produjo una de las primeras ilustraciones y popularizó de manera crucial la noción de un "árbol" evolutivo en su libro seminal El origen de las especies . Más de un siglo después, los biólogos evolucionistas todavía usan diagramas de árbol para representar la evolución porque tales diagramas transmiten efectivamente el concepto de que la especiación ocurre a través de la división adaptativa y semi aleatoria de linajes. Con el tiempo, la clasificación de especies se ha vuelto menos estática y más dinámica.
El término filogenético , o filogenia , deriva de las dos palabras griegas antiguas φῦλον ( phûlon ), que significa "raza, linaje", y γένεσις ( génesis ), que significa "origen, fuente". [4] [5]
Propiedades
Árbol enraizado
Un árbol filogenético enraizado (ver dos gráficos en la parte superior) es un árbol dirigido con un nodo único, la raíz, correspondiente al ancestro común más reciente (generalmente imputado ) de todas las entidades en las hojas del árbol. El nodo raíz no tiene un nodo padre, pero sirve como padre de todos los demás nodos del árbol. Por lo tanto, la raíz es un nodo de grado 2, mientras que otros nodos internos tienen un grado mínimo de 3 (donde "grado" aquí se refiere al número total de bordes entrantes y salientes).
El método más común para enraizar árboles es el uso de un grupo externo no controvertido, lo suficientemente cercano para permitir la inferencia de datos de rasgos o secuenciación molecular, pero lo suficientemente lejos como para ser un grupo externo claro.
Árbol sin raíces
Los árboles sin raíz ilustran la relación de los nodos de las hojas sin hacer suposiciones sobre la ascendencia. No requieren que se conozca o se infiera la raíz ancestral. [7] Los árboles sin raíces siempre se pueden generar a partir de árboles enraizados simplemente omitiendo la raíz. Por el contrario, inferir la raíz de un árbol sin raíz requiere algunos medios para identificar la ascendencia. Esto normalmente se hace incluyendo un grupo externo en los datos de entrada para que la raíz esté necesariamente entre el grupo externo y el resto de los taxones en el árbol, o introduciendo supuestos adicionales sobre las tasas relativas de evolución en cada rama, como una aplicación. de la hipótesis del reloj molecular . [8]
Bifurcación versus multifurcación
Tanto los árboles enraizados como los no enraizados pueden bifurcarse o multifurcarse. Un árbol bifurcado con raíces tiene exactamente dos descendientes que surgen de cada nodo interior (es decir, forma un árbol binario ), y un árbol bifurcado sin raíces toma la forma de un árbol binario sin raíces , un árbol libre con exactamente tres vecinos en cada nodo interno. Por el contrario, un árbol multifurcado enraizado puede tener más de dos hijos en algunos nodos y un árbol multifurcado sin raíces puede tener más de tres vecinos en algunos nodos.
Etiquetado versus sin etiquetar
Tanto los árboles enraizados como los no enraizados se pueden etiquetar o no. Un árbol etiquetado tiene valores específicos asignados a sus hojas, mientras que un árbol sin etiquetar, a veces llamado forma de árbol, define solo una topología. Algunos árboles basados en secuencias construidos a partir de un pequeño locus genómico, como Phylotree, [9] presentan nodos internos etiquetados con haplotipos ancestrales inferidos.
Enumerar árboles
El número de árboles posibles para un número determinado de nodos de hojas depende del tipo específico de árbol, pero siempre hay más árboles etiquetados que no etiquetados, más multifurcantes que bifurcados y más enraizados que sin raíz. La última distinción es la más relevante biológicamente; surge porque hay muchos lugares en un árbol sin raíz para poner la raíz. Para bifurcar árboles etiquetados, el número total de árboles enraizados es:
- por , representa el número de nodos hoja. [10]
Para bifurcar árboles etiquetados, el número total de árboles sin raíces es: [10]
- por .
Entre los árboles bifurcados etiquetados, el número de árboles desarraigados con hojas es igual al número de árboles enraizados con sale de. [3]
El número de árboles enraizados crece rápidamente en función del número de puntas. Para obtener 10 consejos, hay más deposibles árboles en bifurcación, y el número de árboles en multifurcación aumenta más rápido, con ca. 7 veces más de estos últimos que de los primeros.
Hojas etiquetadas | Árboles binarios sin raíz | Árboles de raíces binarias | Árboles enraizados multifurcados | Todos los posibles árboles enraizados |
---|---|---|---|---|
1 | 1 | 1 | 0 | 1 |
2 | 1 | 1 | 0 | 1 |
3 | 1 | 3 | 1 | 4 |
4 | 3 | 15 | 11 | 26 |
5 | 15 | 105 | 131 | 236 |
6 | 105 | 945 | 1.807 | 2,752 |
7 | 945 | 10,395 | 28,813 | 39,208 |
8 | 10,395 | 135,135 | 524,897 | 660.032 |
9 | 135,135 | 2,027,025 | 10,791,887 | 12,818,912 |
10 | 2,027,025 | 34,459,425 | 247,678,399 | 282,137,824 |
Tipos de árboles especiales
Dendrograma
Un dendrograma es un nombre general para un árbol, sea filogenético o no, y por lo tanto también para la representación esquemática de un árbol filogenético. [11]
Cladograma
Un cladograma solo representa un patrón de ramificación; es decir, las longitudes de sus ramas no representan el tiempo o la cantidad relativa de cambio de carácter, y sus nodos internos no representan antepasados. [12]
Filograma
Un filograma es un árbol filogenético que tiene una longitud de rama proporcional a la cantidad de cambio de carácter. [13]
Cronograma
Un cronograma es un árbol filogenético que representa explícitamente el tiempo a través de la longitud de sus ramas. [15]
Dahlgrenograma
Un Dahlgrenograma es un diagrama que representa una sección transversal de un árbol filogenético.
Red filogenética
Una red filogenética no es estrictamente un árbol, sino un gráfico más general , o un gráfico acíclico dirigido en el caso de redes enraizadas. Se utilizan para superar algunas de las limitaciones inherentes a los árboles.
Diagrama de husillo
Un diagrama de huso, o diagrama de burbujas, a menudo se denomina romerograma, después de su popularización por el paleontólogo estadounidense Alfred Romer . [16] Representa la diversidad taxonómica (ancho horizontal) frente al tiempo geológico (eje vertical) para reflejar la variación de abundancia de varios taxones a través del tiempo. Sin embargo, un diagrama de huso no es un árbol evolutivo: [17] los husos taxonómicos oscurecen las relaciones reales del taxón padre con el taxón hijo [16] y tienen la desventaja de involucrar la parafilia del grupo parental. [18] Este tipo de diagrama ya no se utiliza en la forma propuesta originalmente. [18]
Coral de la vida
Darwin [19] también mencionó que el coral puede ser una metáfora más adecuada que el árbol . De hecho, los corales filogenéticos son útiles para retratar la vida pasada y presente, y tienen algunas ventajas sobre los árboles (se permiten anastomosis, etc.). [18]
Construcción
Los árboles filogenéticos compuestos con un número considerable de secuencias de entrada se construyen utilizando métodos filogenéticos computacionales . Los métodos de matriz de distancia como la unión de vecinos o UPGMA , que calculan la distancia genética a partir de múltiples alineamientos de secuencia , son los más sencillos de implementar, pero no invocan un modelo evolutivo. Muchos métodos de alineación de secuencias, como ClustalW, también crean árboles mediante el uso de algoritmos más simples (es decir, aquellos basados en la distancia) de la construcción de árboles. La parsimonia máxima es otro método simple de estimar árboles filogenéticos, pero implica un modelo implícito de evolución (es decir, parsimonia). Los métodos más avanzados utilizan el criterio de optimalidad de máxima verosimilitud , a menudo dentro de un marco bayesiano , y aplican un modelo explícito de evolución a la estimación de árboles filogenéticos. [3] Identificar el árbol óptimo usando muchas de estas técnicas es NP-difícil , [3] por lo que los métodos heurísticos de búsqueda y optimización se usan en combinación con funciones de puntuación de árboles para identificar un árbol razonablemente bueno que se ajuste a los datos.
Los métodos de construcción de árboles pueden evaluarse sobre la base de varios criterios: [20]
- eficiencia (¿cuánto tiempo se tarda en calcular la respuesta, cuánta memoria se necesita?)
- poder (¿hace un buen uso de los datos o se está desperdiciando información?)
- consistencia (¿convergerá en la misma respuesta repetidamente, si cada vez se dan datos diferentes para el mismo problema de modelo?)
- robustez (¿se adapta bien a las violaciones de los supuestos del modelo subyacente?)
- falsabilidad (¿nos alerta cuando no es bueno usarlo, es decir, cuando se violan las suposiciones?)
Las técnicas de construcción de árboles también han llamado la atención de los matemáticos. Los árboles también pueden ser construidos usando T-teoría . [21]
Formatos de archivo
Los árboles se pueden codificar en varios formatos diferentes, todos los cuales deben representar la estructura anidada de un árbol. Pueden codificar o no las longitudes de las ramas y otras características. Los formatos estandarizados son fundamentales para distribuir y compartir árboles sin depender de la salida de gráficos que es difícil de importar al software existente. Los formatos más utilizados son
- Formato de archivo Nexus
- Formato Newick
Limitaciones del análisis filogenético
Aunque los árboles filogenéticos producidos sobre la base de genes secuenciados o datos genómicos en diferentes especies pueden proporcionar información evolutiva, estos análisis tienen limitaciones importantes. Lo más importante es que los árboles que generan no son necesariamente correctos; no necesariamente representan con precisión la historia evolutiva de los taxones incluidos. Como ocurre con cualquier resultado científico, están sujetos a falsificación mediante estudios adicionales (por ejemplo, recopilación de datos adicionales, análisis de los datos existentes con métodos mejorados). Los datos en los que se basan pueden ser ruidosos ; [22] el análisis puede confundirse por recombinación genética , [23] transferencia horizontal de genes , [24] hibridación entre especies que no eran vecinas más cercanas en el árbol antes de que se produzca la hibridación, evolución convergente y secuencias conservadas .
Además, existen problemas para basar un análisis en un solo tipo de carácter, como un solo gen o proteína o solo en el análisis morfológico, porque tales árboles construidos a partir de otra fuente de datos no relacionada a menudo difieren de la primera y, por lo tanto, se necesita mucho cuidado. en inferir relaciones filogenéticas entre especies. Esto es más cierto para el material genético que está sujeto a transferencia lateral de genes y recombinación , donde diferentes bloques de haplotipos pueden tener diferentes historias. En estos tipos de análisis, el árbol de salida de un análisis filogenético de un solo gen es una estimación de la filogenia del gen (es decir, un árbol de genes) y no la filogenia de los taxones (es decir, el árbol de especies) de los que se tomaron muestras de estos caracteres, aunque idealmente, ambos deberían estar muy cerca. Por esta razón, los estudios filogenéticos serios generalmente usan una combinación de genes que provienen de diferentes fuentes genómicas (p. Ej., De genomas mitocondriales o plástidos frente a genomas nucleares), [25] o genes que se esperaría que evolucionen bajo diferentes regímenes selectivos, de modo que La homoplasia (falsa homología ) es poco probable que resulte de la selección natural.
Cuando se incluyen especies extintas como nodos terminales en un análisis (en lugar de, por ejemplo, restringir los nodos internos), se considera que no representan antepasados directos de ninguna especie existente. Las especies extintas no suelen contener ADN de alta calidad .
La gama de materiales de ADN útiles se ha ampliado con los avances en las tecnologías de extracción y secuenciación. El desarrollo de tecnologías capaces de inferir secuencias a partir de fragmentos más pequeños o de patrones espaciales de productos de degradación del ADN ampliaría aún más la gama de ADN que se considera útil.
Los árboles filogenéticos también se pueden inferir a partir de una variedad de otros tipos de datos, incluida la morfología, la presencia o ausencia de tipos particulares de genes, eventos de inserción y deleción, y cualquier otra observación que se cree que contiene una señal evolutiva.
Las redes filogenéticas se utilizan cuando la bifurcación de árboles no es adecuada, debido a estas complicaciones que sugieren una historia evolutiva más reticulada de los organismos muestreados.
Ver también
- Clade
- Cladística
- Filogenética computacional
- Taxonomía evolutiva
- Biología evolucionaria
- Alineación de árboles generalizada
- Lista de software filogenético
- Lista de software de visualización de árboles filogenéticos
- Métodos comparativos filogenéticos
Referencias
- ^ Letunic, Ivica; Bork, Peer (1 de enero de 2007). "Interactive Tree Of Life (iTOL): una herramienta en línea para la visualización y anotación de árboles filogenéticos" (PDF) . Bioinformática . 23 (1): 127-128. doi : 10.1093 / bioinformatics / btl529 . ISSN 1367-4803 . PMID 17050570 . Archivado (PDF) desde el original el 29 de noviembre de 2015 . Consultado el 21 de julio de 2015 .
- ^ Ciccarelli, FD; Doerks, T .; Von Mering, C .; Creevey, CJ; Snel, B .; Bork, P. (2006). "Hacia la reconstrucción automática de un árbol de la vida altamente resuelto" (PDF) . Ciencia . 311 (5765): 1283–1287. Código bibliográfico : 2006Sci ... 311.1283C . CiteSeerX 10.1.1.381.9514 . doi : 10.1126 / science.1123061 . PMID 16513982 . S2CID 1615592 .
- ↑ a b c d Felsenstein J. (2004). Inferir filogenias Sinauer Associates: Sunderland, MA.
- ^ Bailly, Anatole (1 de enero de 1981). Abrégé du dictionnaire grec français . París: Hachette. ISBN 978-2010035289. OCLC 461974285 .
- ^ Bailly, Anatole. "Diccionario griego-francés en línea" . www.tabularium.be . Archivado desde el original el 21 de abril de 2014 . Consultado el 2 de marzo de 2018 .
- ^ Hodge T, Cope M (1 de octubre de 2000). "Un árbol genealógico de la miosina" . J Cell Sci . 113 (19): 3353–4. PMID 10984423 . Archivado desde el original el 30 de septiembre de 2007.
- ^ " Hechos del " árbol ": árboles enraizados versus árboles sin raíz" . Archivado desde el original el 14 de abril de 2014 . Consultado el 26 de mayo de 2014 .
- ^ Maher BA (2002). "Arrancando el árbol de la vida" . El científico . 16 (2): 90–95. Código Bibliográfico : 2000SciAm.282b..90D . doi : 10.1038 / scientificamerican0200-90 . PMID 10710791 . Archivado desde el original el 2 de octubre de 2003.
- ^ van Oven, Mannis; Kayser, Manfred (2009). "Árbol filogenético completo actualizado de la variación del ADN mitocondrial humano global" . Mutación humana . 30 (2): E386 – E394. doi : 10.1002 / humu.20921 . PMID 18853457 . S2CID 27566749 .
- ^ a b c Felsenstein, Joseph (1 de marzo de 1978). "El número de árboles evolutivos" . Biología sistemática . 27 (1): 27–33. doi : 10.2307 / 2412810 . ISSN 1063-5157 . JSTOR 2412810 .
- ^ Fox, Emily. "El dendrograma" . cursoa . cursoa. Archivado desde el original el 28 de septiembre de 2017 . Consultado el 28 de septiembre de 2017 .
- ^ Mayr, Ernst (2009) "¿Análisis cladístico o clasificación cladística?". Revista de Sistemática Zoológica e Investigación Evolutiva. 12: 94-128. doi: 10.1111 / j.1439-0469.1974.tb00160.x ..
- ^ Soares, Antonio; Râbelo, Ricardo; Delbem, Alexandre (2017). "Optimización basada en análisis de filogramas". Sistemas expertos con aplicaciones . 78 : 32–50. doi : 10.1016 / j.eswa.2017.02.012 . ISSN 0957-4174 .
- ^ Labandeira, CC; Dilcher, DL; Davis, DR; Wagner, DL (6 de diciembre de 1994). "Noventa y siete millones de años de asociación angiosperma-insecto: conocimientos paleobiológicos sobre el significado de la coevolución" . Actas de la Academia Nacional de Ciencias . 91 (25): 12278–12282. Código Bibliográfico : 1994PNAS ... 9112278L . doi : 10.1073 / pnas.91.25.12278 . ISSN 0027-8424 . PMC 45420 . PMID 11607501 .
- ^ Santamaria, R .; Theron, R. (26 de mayo de 2009). "Treevolution: análisis visual de árboles filogenéticos" . Bioinformática . 25 (15): 1970–1971. doi : 10.1093 / bioinformatics / btp333 . PMID 19470585 .
- ^ a b "Sistemática evolutiva: diagramas de husillo" . Palaeos.com . 2014-11-10 . Consultado el 7 de noviembre de 2019 .
- ^ "Árboles, burbujas y cascos" . Un cerebro de mono de tres libras - Biología, programación, lingüística, filogenia, sistemática… . 2007-11-21 . Consultado el 7 de noviembre de 2019 .
- ^ a b c Podani, János (1 de junio de 2019). "El Coral de la Vida" . Biología evolutiva . 46 (2): 123-144. doi : 10.1007 / s11692-019-09474-w . ISSN 1934-2845 .
- ^ Darwin, Charles (1837). Notebook B . pag. 25.
- ^ Penny, D .; Hendy, MD; Acero, MA (1992). "Progreso con métodos para la construcción de árboles evolutivos". Tendencias en ecología y evolución . 7 (3): 73–79. doi : 10.1016 / 0169-5347 (92) 90244-6 . PMID 21235960 .
- ↑ A. Dress, KT Huber y V. Moulton. 2001. Espacios métricos en matemáticas puras y aplicadas. Documenta Mathematica LSU 2001 : 121-139
- ^ Townsend JP, Su Z, Tekle Y (2012). "Ruido y señal filogenética: predecir el poder de un conjunto de datos para resolver la filogenia" . Genética . 61 (5): 835–849. doi : 10.1093 / sysbio / sys036 . PMID 22389443 .
- ^ Arenas M, Posada D (2010). "El efecto de la recombinación en la reconstrucción de secuencias ancestrales" . Genética . 184 (4): 1133-1139. doi : 10.1534 / genetics.109.113423 . PMC 2865913 . PMID 20124027 .
- ^ Woese C (2002). "Sobre la evolución de las células" . Proc Natl Acad Sci USA . 99 (13): 8742–7. Código Bibliográfico : 2002PNAS ... 99.8742W . doi : 10.1073 / pnas.132266999 . PMC 124369 . PMID 12077305 .
- ^ Parhi, J .; Tripatía, PS; Priyadarshi, H .; Mandal, SC; Pandey, PK (2019). "Diagnóstico de mitogenoma para filogenia robusta: un caso de grupo de peces Cypriniformes". Gene . 713 : 143967. doi : 10.1016 / j.gene.2019.143967 . PMID 31279710 .
Otras lecturas
- Schuh, RT y AVZ Brower. 2009. Sistemática biológica: principios y aplicaciones (2ª ed.)ISBN 978-0-8014-4799-0
- Manuel Lima , The Book of Trees: Visualizing Branches of Knowledge , 2014, Princeton Architectural Press, Nueva York.
- MEGA , un software gratuito para dibujar árboles filogenéticos.
- Gontier, N. 2011. "Representando el árbol de la vida: las raíces filosóficas e históricas de los diagramas evolutivos del árbol". Evolución, educación, alcance 4: 515–538.
enlaces externos
Imagenes
- Árbol filogenético del cromosoma Y humano 2002
- iTOL: Árbol de la vida interactivo
- Árbol filogenético de organismos artificiales evolucionados en computadoras
- Filograma de mamíferos euterios de Miyamoto y Goodman
General
- Una descripción general de los diferentes métodos de visualización de árboles está disponible en Página, RDM (2011). "Espacio, tiempo, forma: Ver el árbol de la vida". Tendencias en Ecología y Evolución . 27 (2): 113–120. doi : 10.1016 / j.tree.2011.12.002 . PMID 22209094 .
- OneZoom: Tree of Life: todas las especies vivientes como explorador fractal intuitivo y ampliable (diseño receptivo)
- Discover Life Un árbol interactivo basado en el proyecto Ensamblando el árbol de la vida de la Fundación Nacional de Ciencias de EE. UU.
- PhyloCode
- Una alineación múltiple de 139 secuencias de miosina y un árbol filogenético
- Proyecto web Árbol de la vida
- Inferencia filogenética en el servidor T-REX
- Base de datos de taxonomía del NCBI [1]
- ETE: un entorno de Python para la exploración de árboles Esta es una biblioteca de programación para analizar, manipular y visualizar árboles filogenéticos. Árbitro.
- Un árbol de vida (secuenciado) actualizado diariamenteFang, H .; Oates, ME; Pethica, RB; Greenwood, JM; Sardar, AJ; Rackham, OJL; Donoghue, PCJ; Stamatakis, A .; De Lima Morais, DA; Gough, J. (2013). "Un árbol de vida (secuenciado) actualizado diariamente como referencia para la investigación del genoma" . Informes científicos . 3 : 2015. Código Bibliográfico : 2013NatSR ... 3E2015F . doi : 10.1038 / srep02015 . PMC 6504836 . PMID 23778980 .