La reconstrucción ancestral (también conocida como mapeo de caracteres u optimización de caracteres ) es la extrapolación en el tiempo de las características medidas de los individuos (o poblaciones) a sus ancestros comunes . Es una importante aplicación de la filogenética , la reconstrucción y el estudio de las relaciones evolutivas entre individuos, poblaciones o especies con sus ancestros. En el contexto de la biología evolutiva , la reconstrucción ancestral se puede utilizar para recuperar diferentes tipos de estados de carácter ancestral de organismos que vivieron hace millones de años. [1] Estos estados incluyen la secuencia genética( reconstrucción de la secuencia ancestral ), la secuencia de aminoácidos de una proteína , la composición de un genoma (por ejemplo, el orden de los genes), una característica medible de un organismo ( fenotipo ) y el rango geográfico de una población o especie ancestral (reconstrucción del rango ancestral ). Esto es deseable porque nos permite examinar partes de árboles filogenéticos correspondientes al pasado lejano, aclarando la historia evolutiva de las especies en el árbol. Dado que las secuencias genéticas modernas son esencialmente una variación de las antiguas, el acceso a secuencias antiguas puede identificar otras variaciones y organismos que podrían haber surgido de esas secuencias. [2] Además de las secuencias genéticas, uno podría intentar rastrear el cambio de un rasgo de carácter a otro, como las aletas que se convierten en patas.
Aplicaciones no biológicas incluyen la reconstrucción del vocabulario o fonemas de las lenguas antiguas , [3] y las características culturales de las sociedades antiguas, como las tradiciones orales [4] o las prácticas matrimoniales. [5]
La reconstrucción ancestral se basa en un modelo estadístico de evolución suficientemente realista para recuperar con precisión los estados ancestrales. Estos modelos utilizan la información genética ya obtenida a través de métodos tales como la filogenética para determinar la ruta que la evolución ha tomado y cuando se produjeron eventos evolutivos. [6] No importa qué tan bien se aproxime el modelo a la historia evolutiva real, sin embargo, la capacidad de uno para reconstruir con precisión un ancestro se deteriora con el aumento del tiempo evolutivo entre ese ancestro y sus descendientes observados. Además, los modelos de evolución más realistas son inevitablemente más complejos y difíciles de calcular. El progreso en el campo de la reconstrucción ancestral se ha basado en gran medida en el crecimiento exponencial del poder de computación y el desarrollo concomitante de algoritmos computacionales eficientes (por ejemplo, un algoritmo de programación dinámica para la reconstrucción conjunta de máxima verosimilitud de secuencias ancestrales). [7] Los métodos de reconstrucción ancestral a menudo se aplican a un árbol filogenético dado que ya se ha inferido de los mismos datos. Si bien es conveniente, este enfoque tiene la desventaja de que sus resultados dependen de la precisión de un solo árbol filogenético. En contraste, algunos investigadores [8] abogan por un enfoque bayesiano más intensivo en computación que tenga en cuenta la incertidumbre en la reconstrucción de árboles mediante la evaluación de reconstrucciones ancestrales en muchos árboles.
Historia
El concepto de reconstrucción ancestral se atribuye a menudo a Emile Zuckerkandl y Linus Pauling . Motivados por el desarrollo de técnicas para determinar la secuencia primaria (aminoácidos) de proteínas por Frederick Sanger en 1955, [9] Zuckerkandl y Pauling postularon [10] que tales secuencias podrían usarse para inferir no solo la filogenia que relaciona las secuencias de proteínas observadas , sino también la secuencia de proteínas ancestrales en el punto más temprano (raíz) de este árbol. Sin embargo, la idea de reconstruir ancestros a partir de características biológicas mensurables ya se había desarrollado en el campo de la cladística , uno de los precursores de la filogenética moderna. Los métodos cladísticos, que aparecieron ya en 1901, infieren las relaciones evolutivas de las especies sobre la base de la distribución de características compartidas, de las cuales se infiere que algunas descienden de ancestros comunes. Además, Theodoseus Dobzhansky y Alfred Sturtevant articularon los principios de la reconstrucción ancestral en un contexto filogenético en 1938, al inferir la historia evolutiva de las inversiones cromosómicas en Drosophila pseudoobscura . [11]
Así, la reconstrucción ancestral tiene sus raíces en varias disciplinas. Hoy en día, los métodos computacionales para la reconstrucción ancestral continúan extendiéndose y aplicándose en una diversidad de escenarios, por lo que los estados ancestrales se están infiriendo no solo por las características biológicas y las secuencias moleculares, sino también por la estructura [12] [13] o propiedades catalíticas . [14] de proteínas antiguas versus modernas , la ubicación geográfica de poblaciones y especies ( filogeografía ) [15] [16] y la estructura de orden superior de los genomas. [17]
Métodos y algoritmos
Cualquier intento de reconstrucción ancestral comienza con una filogenia . En general, una filogenia es una hipótesis basada en árboles sobre el orden en el que las poblaciones (denominadas taxones ) están relacionadas por descendencia de ancestros comunes. Los taxones observados están representados por las puntas o nodos terminales del árbol que están conectados progresivamente por ramas a sus ancestros comunes, que están representados por los puntos de ramificación del árbol que generalmente se conocen como los nodos ancestrales o internos . Finalmente, todos los linajes convergen en el ancestro común más reciente de toda la muestra de taxones. En el contexto de la reconstrucción ancestral, una filogenia a menudo se trata como si fuera una cantidad conocida (siendo los enfoques bayesianos una excepción importante). Debido a que puede haber una enorme cantidad de filogenias que son casi igualmente efectivas para explicar los datos, reducir el subconjunto de filogenias respaldadas por los datos a un solo representante, o estimación puntual, puede ser una suposición simplificadora conveniente y a veces necesaria.
Se puede pensar en la reconstrucción ancestral como el resultado directo de aplicar un modelo hipotético de evolución a una filogenia determinada. Cuando el modelo contiene uno o más parámetros libres, el objetivo general es estimar estos parámetros sobre la base de las características medidas entre los taxones observados (secuencias) que descienden de ancestros comunes. La parsimonia es una excepción importante a este paradigma: aunque se ha demostrado que hay circunstancias en las que es el estimador de máxima verosimilitud, [18] en su esencia, se basa simplemente en la heurística de que los cambios en el estado del carácter son raros, sin intentando cuantificar esa rareza.
Hay tres clases diferentes de métodos para la reconstrucción ancestral. En orden cronológico de descubrimiento, estos son máxima parsimonia , máxima verosimilitud e inferencia bayesiana . La máxima parsimonia considera todos los eventos evolutivos igualmente probables; la máxima probabilidad da cuenta de la diferente probabilidad de ciertas clases de eventos; y la inferencia de Bayeisan relaciona la probabilidad condicional de un evento con la probabilidad del árbol, así como la cantidad de incertidumbre asociada con ese árbol. La parsimonia máxima y la probabilidad máxima producen un resultado único más probable, mientras que la inferencia bayesiana explica las incertidumbres en los datos y produce una muestra de árboles posibles.
Máxima parsimonia
La parsimonia, conocida coloquialmente como "la navaja de Occam ", se refiere al principio de seleccionar la hipótesis más simple en competencia. En el contexto de la reconstrucción ancestral, la parsimonia se esfuerza por encontrar la distribución de los estados ancestrales dentro de un árbol dado, lo que minimiza el número total de cambios de estado de carácter que serían necesarios para explicar los estados observados en las puntas del árbol. Este método de máxima parsimonia [19] es uno de los primeros algoritmos formalizados para reconstruir estados ancestrales, así como uno de los más simples. [13]
La máxima parsimonia se puede implementar mediante uno de varios algoritmos. Uno de los primeros ejemplos es el método de Fitch , [20] que asigna estados de caracteres ancestrales por parsimonia a través de dos recorridos de un árbol binario enraizado . La primera etapa es un recorrido posterior al pedido que procede de las puntas hacia la raíz de un árbol visitando los nodos descendientes (secundarios) antes que sus padres. Inicialmente, estamos determinando el conjunto de posibles estados de carácter S i para el i -ésimo antepasado en función de los estados de carácter observados de sus descendientes. Cada asignación es la intersección establecida de los estados de carácter de los descendientes del antepasado; si la intersección es el conjunto vacío, entonces es la unión del conjunto . En el último caso, se da a entender que se ha producido un cambio de estado de carácter entre el antepasado y uno de sus dos descendientes inmediatos. Cada uno de estos eventos cuenta para la función de costo del algoritmo, que puede usarse para discriminar entre árboles alternativos sobre la base de la máxima parsimonia. A continuación, se realiza un recorrido de preorden del árbol, desde la raíz hacia las puntas. A continuación, se asignan estados de carácter a cada descendiente en función de los estados de carácter que comparte con su padre. Dado que la raíz no tiene un nodo padre, puede ser necesario seleccionar un estado de carácter arbitrariamente, específicamente cuando se ha reconstruido más de un estado posible en la raíz.
Por ejemplo, considere una filogenia recuperada para un género de plantas que contiene 6 especies A - F, donde cada planta es polinizada por una "abeja", un "colibrí" o un "viento". Una pregunta obvia es cuáles eran los polinizadores en los nodos más profundos en la filogenia de este género de plantas. Bajo la máxima parsimonia, una reconstrucción del estado ancestral para este clado revela que "colibrí" es el estado ancestral más parsimonioso para el clado inferior (plantas D, E, F), que los estados ancestrales para los nodos en el clado superior (plantas A, B, C) son equívocos y que tanto los polinizadores "colibríes" como los "abejas" son igualmente plausibles para el estado de polinización en la raíz de la filogenia. Supongamos que tenemos pruebas sólidas del registro fósil de que el estado de la raíz es "colibrí". La resolución de la raíz a "colibrí" produciría el patrón de reconstrucción del estado ancestral representado por los símbolos en los nodos con el estado que requiere la menor cantidad de cambios encerrados en un círculo.
Los métodos de parsimonia son intuitivamente atractivos y altamente eficientes, de modo que todavía se usan en algunos casos para sembrar algoritmos de optimización de máxima verosimilitud con una filogenia inicial. [21] Sin embargo, la suposición subyacente de que la evolución alcanzó un determinado resultado final lo más rápido posible es inexacta. La selección natural y la evolución no funcionan hacia un objetivo, simplemente seleccionan a favor o en contra de los cambios genéticos que ocurren al azar. Los métodos de parsimonia imponen seis suposiciones generales: que el árbol filogenético que está utilizando es correcto, que tiene todos los datos relevantes, en los que no se cometieron errores en la codificación, que todas las ramas del árbol filogenético tienen la misma probabilidad de cambiar, que el La tasa de evolución es lenta y la probabilidad de perder o ganar una característica es la misma. [1] En realidad, las suposiciones a menudo se violan, lo que genera varios problemas:
- Variación de las tasas de evolución. El método de Fitch asume que los cambios entre todos los estados de carácter tienen la misma probabilidad de ocurrir; por lo tanto, cualquier cambio incurre en el mismo costo para un árbol dado. Esta suposición es a menudo poco realista y puede limitar la precisión de tales métodos. [8] Por ejemplo, las transiciones tienden a ocurrir con más frecuencia que las transversiones en la evolución de los ácidos nucleicos. Esta suposición se puede relajar asignando costos diferenciales a cambios de estado de carácter específicos, lo que da como resultado un algoritmo de parsimonia ponderado. [22]
- Evolución rápida. El resultado de la heurística de "evolución mínima" subyacente a tales métodos es que dichos métodos suponen que los cambios son raros y, por lo tanto, inapropiados en los casos en que el cambio es la norma y no la excepción. [23] [24]
- Variación en el tiempo entre linajes. Los métodos de parsimonia suponen implícitamente que ha pasado la misma cantidad de tiempo evolutivo a lo largo de cada rama del árbol. Por lo tanto, no tienen en cuenta la variación en la longitud de las ramas del árbol, que a menudo se utilizan para cuantificar el paso del tiempo evolutivo o cronológico. Esta limitación hace que la técnica pueda inferir que un cambio ocurrió en una rama muy corta en lugar de múltiples cambios que ocurren en una rama muy larga, por ejemplo. [25] Además, es posible que algunas ramas del árbol experimenten tasas de selección y cambio más altas que otras, quizás debido a factores ambientales cambiantes. Algunos períodos de tiempo pueden representar una evolución más rápida que otros, cuando esto ocurre, la parsimonia se vuelve inexacta. [26] Esta deficiencia se aborda mediante métodos basados en modelos (tanto de máxima verosimilitud como métodos bayesianos) que infieren el proceso estocástico de evolución a medida que se desarrolla a lo largo de cada rama de un árbol. [27]
- Justificación estadística. Sin un modelo estadístico subyacente al método, sus estimaciones no tienen incertidumbres bien definidas. [23] [25] [28]
- Evolución convergente. Al considerar el estado de un solo carácter, la parsimonia asumirá automáticamente que dos organismos que comparten esa característica estarán más estrechamente relacionados que aquellos que no lo hacen. Por ejemplo, el hecho de que los perros y los simios tengan pelaje no significa que estén más relacionados que los simios con los humanos.
Máxima verosimilitud
Los métodos de máxima verosimilitud (ML) de reconstrucción de estados ancestrales tratan los estados de carácter en los nodos internos del árbol como parámetros e intentan encontrar los valores de los parámetros que maximizan la probabilidad de los datos (los estados de carácter observados) dada la hipótesis (un modelo de evolución y una filogenia que relaciona las secuencias o taxones observados). En otras palabras, este método asume que los estados ancestrales son los estadísticamente más probables, dados los fenotipos observados. Algunos de los primeros enfoques de ML para la reconstrucción ancestral se desarrollaron en el contexto de la evolución de la secuencia genética ; [29] [30] También se desarrollaron modelos similares para el caso análogo de evolución de carácter discreto. [31]
El uso de un modelo de evolución explica el hecho de que no todos los eventos tienen la misma probabilidad de ocurrir. Por ejemplo, es mucho más probable que ocurra una transición , que es un tipo de mutación puntual de una purina a otra, o de una pirimidina a otra que una transversión , que es la posibilidad de que una purina se cambie a una pirimidina, o viceversa. al revés. Estas diferencias no se capturan con la máxima parsimonia. Sin embargo, el hecho de que algunos eventos sean más probables que otros no significa que siempre sucedan. Sabemos que a lo largo de la historia evolutiva ha habido momentos en los que hubo una gran brecha entre lo que era más probable que sucediera y lo que realmente sucedió. Cuando este es el caso, la máxima parsimonia en realidad puede ser más precisa porque está más dispuesto a dar saltos grandes e improbables que la máxima probabilidad. Se ha demostrado que la máxima verosimilitud es bastante confiable en la reconstrucción de estados de carácter, pero no hace un trabajo tan bueno al dar estimaciones precisas de la estabilidad de las proteínas. La probabilidad máxima siempre sobreestima la estabilidad de las proteínas, lo que tiene sentido ya que supone que las proteínas que se fabricaron y utilizaron fueron las más estables y óptimas. [13] Los méritos de la máxima verosimilitud han sido objeto de debate, y algunos han llegado a la conclusión de que la prueba de máxima verosimilitud representa un buen medio entre precisión y velocidad. [32] Sin embargo, otros estudios se han quejado de que la máxima probabilidad requiere demasiado tiempo y poder computacional para ser útil en algunos escenarios. [33]
Estos enfoques emplean el mismo marco probabilístico que se utilizó para inferir el árbol filogenético. [34] En resumen, la evolución de una secuencia genética se modela mediante un proceso de Markov en tiempo continuo reversible en el tiempo . En el más simple de estos, todos los caracteres experimentan transiciones de estado independientes (como sustituciones de nucleótidos) a una tasa constante a lo largo del tiempo. Este modelo básico se amplía con frecuencia para permitir diferentes tasas en cada rama del árbol. En realidad, las tasas de mutación también pueden variar con el tiempo (debido, por ejemplo, a cambios ambientales); esto se puede modelar permitiendo que los parámetros de tasa evolucionen a lo largo del árbol, a expensas de tener un mayor número de parámetros. Un modelo define las probabilidades de transición de los estados i al j a lo largo de una rama de longitud t (en unidades de tiempo evolutivo). La probabilidad de una filogenia se calcula a partir de una suma anidada de probabilidades de transición que corresponde a la estructura jerárquica del árbol propuesto. En cada nodo, la probabilidad de sus descendientes se suma a todos los posibles estados de caracteres ancestrales en ese nodo:
donde estamos calculando la probabilidad de que el subárbol enraizado en el nodo x con descendientes directos y y z ,denota el estado de carácter del i -ésimo nodo,es la longitud de la rama (tiempo evolutivo) entre los nodos i y j , yes el conjunto de todos los posibles estados de caracteres (por ejemplo, los nucleótidos A, C, G y T). [34] Así, el objetivo de la reconstrucción ancestral es encontrar la asignación apara todos los x nodos internos que maximiza la probabilidad de los datos observados para un árbol dado.
Probabilidad marginal y conjunta
En lugar de calcular la probabilidad general de árboles alternativos, el problema de la reconstrucción ancestral es encontrar la combinación de estados de carácter en cada nodo ancestral con la probabilidad máxima marginal más alta. En términos generales, existen dos enfoques para este problema. Primero, se puede asignar el estado de carácter más probable a cada antepasado independientemente de la reconstrucción de todos los demás estados ancestrales. Este enfoque se conoce como reconstrucción marginal . Es similar a sumar todas las combinaciones de estados ancestrales en todos los demás nodos del árbol (incluido el nodo raíz), distintos de aquellos para los que hay datos disponibles. La reconstrucción marginal consiste en encontrar el estado en el nodo actual que maximiza la probabilidad de integrarse sobre todos los demás estados en todos los nodos, en proporción a su probabilidad. En segundo lugar, se puede intentar, en cambio, encontrar la combinación conjunta de estados de carácter ancestral en todo el árbol que maximice conjuntamente la probabilidad de todo el conjunto de datos. Por lo tanto, este enfoque se conoce como reconstrucción articular. [29] No es sorprendente que la reconstrucción articular sea más compleja computacionalmente que la reconstrucción marginal. Sin embargo, se han desarrollado algoritmos eficientes para la reconstrucción conjunta con una complejidad temporal que generalmente es lineal con el número de taxones o secuencias observados. [7]
Los métodos de reconstrucción ancestral basados en ML tienden a proporcionar una mayor precisión que los métodos de MP en presencia de variación en las tasas de evolución entre personajes (o entre sitios en un genoma). [35] [36] Sin embargo, estos métodos aún no son capaces de adaptarse a la variación en las tasas de evolución a lo largo del tiempo, también conocida como heterotaquia . Si la tasa de evolución de un carácter específico se acelera en una rama de la filogenia, entonces la cantidad de evolución que ha ocurrido en esa rama será subestimada para una longitud determinada de la rama y asumiendo una tasa de evolución constante para ese carácter. Además de eso, es difícil distinguir la heterotaquia de la variación entre caracteres en las tasas de evolución. [37]
Dado que ML (a diferencia de la parsimonia máxima) requiere que el investigador especifique un modelo de evolución, su precisión puede verse afectada por el uso de un modelo extremadamente incorrecto (especificación errónea del modelo). Además, ML solo puede proporcionar una reconstrucción única de los estados de los caracteres (lo que a menudo se denomina "estimación puntual"): cuando la superficie de probabilidad es muy no convexa y comprende varios picos (óptimos locales), una estimación puntual única no puede proporcionar una representación adecuada, y un enfoque bayesiano puede ser más adecuado.
Inferencia bayesiana
La inferencia bayesiana utiliza la probabilidad de los datos observados para actualizar la creencia del investigador, o distribución previa , para producir la distribución posterior . En el contexto de la reconstrucción ancestral, el objetivo es inferir las probabilidades posteriores de los estados de carácter ancestral en cada nodo interno de un árbol dado. Además, se pueden integrar estas probabilidades sobre las distribuciones posteriores sobre los parámetros del modelo evolutivo y el espacio de todos los árboles posibles. Esto se puede expresar como una aplicación del teorema de Bayes :
donde S representa los estados ancestrales, D corresponde a los datos observados, y representa tanto el modelo evolutivo como el árbol filogenético. es la probabilidad de los datos observados que se pueden calcular mediante el algoritmo de poda de Felsenstein como se indica anteriormente.es la probabilidad previa de los estados ancestrales para un modelo y árbol determinados. Finalmente, es la probabilidad de los datos para un modelo y árbol dados, integrados sobre todos los estados ancestrales posibles.
La inferencia bayesiana es el método que muchos han argumentado que es el más preciso. [8] En general, los métodos estadísticos bayesianos permiten a los investigadores combinar información preexistente con nuevas hipótesis. En el caso de la evolución, combina la probabilidad de los datos observados con la probabilidad de que los eventos ocurrieran en el orden en que sucedieron, reconociendo al mismo tiempo el potencial de error e incertidumbre. En general, es el método más preciso para reconstruir secuencias genéticas ancestrales, así como la estabilidad de las proteínas. [25] A diferencia de los otros dos métodos, la inferencia bayesiana produce una distribución de árboles posibles, lo que permite estimaciones más precisas y fácilmente interpretables de la varianza de los posibles resultados. [38]
Hemos dado dos formulaciones arriba para enfatizar las dos aplicaciones diferentes del teorema de Bayes, que discutimos en la siguiente sección.
Bayes empírico y jerárquico
Una de las primeras implementaciones de un enfoque bayesiano para la reconstrucción de secuencias ancestrales fue desarrollada por Yang y sus colegas, [29] donde las estimaciones de máxima verosimilitud del modelo evolutivo y el árbol, respectivamente, se utilizaron para definir las distribuciones previas. Por lo tanto, su enfoque es un ejemplo de un método empírico de Bayes para calcular las probabilidades posteriores de los estados de carácter ancestrales; este método se implementó por primera vez en el paquete de software PAML. [39] En términos de la formulación de la regla bayesiana anterior, el método empírico de Bayes corrige a las estimaciones empíricas del modelo y el árbol obtenidos a partir de los datos, eliminando efectivamente a partir de la probabilidad posterior y los términos anteriores de la fórmula. Además, Yang y sus colegas [29] utilizaron la distribución empírica de patrones de sitios (es decir, asignaciones de nucleótidos a las puntas del árbol) en su alineación de secuencias de nucleótidos observadas en el denominador en lugar de calcular exhaustivamentesobre todos los valores posibles de S dados. Computacionalmente, el método empírico de Bayes es similar a la reconstrucción de máxima verosimilitud de estados ancestrales, excepto que, en lugar de buscar la asignación ML de estados en función de sus respectivas distribuciones de probabilidad en cada nodo interno, las distribuciones de probabilidad en sí se informan directamente.
Los métodos empíricos de Bayes para la reconstrucción ancestral requieren que el investigador asuma que los parámetros y el árbol del modelo evolutivo se conocen sin error. Cuando el tamaño o la complejidad de los datos hacen que esto sea una suposición poco realista, puede ser más prudente adoptar el enfoque bayesiano completamente jerárquico e inferir la distribución posterior conjunta sobre los estados de carácter ancestrales, el modelo y el árbol. [40] Huelsenbeck y Bollback propusieron por primera vez [40] un método de Bayes jerárquico para la reconstrucción ancestral utilizando métodos de cadena de Markov Monte Carlo (MCMC) para muestrear secuencias ancestrales de esta distribución posterior conjunta. También se utilizó un enfoque similar para reconstruir la evolución de la simbiosis con algas en especies de hongos ( liquenización ). [41] Por ejemplo, el algoritmo Metropolis-Hastings para MCMC explora la distribución posterior conjunta aceptando o rechazando asignaciones de parámetros sobre la base de la razón de probabilidades posteriores.
En pocas palabras, el enfoque empírico de Bayes calcula las probabilidades de varios estados ancestrales para un árbol y modelo de evolución específicos. Al expresar la reconstrucción de estados ancestrales como un conjunto de probabilidades, se puede cuantificar directamente la incertidumbre para asignar un estado particular a un ancestro. Por otro lado, el enfoque jerárquico de Bayes promedia estas probabilidades sobre todos los árboles y modelos de evolución posibles, en proporción a la probabilidad de estos árboles y modelos, dados los datos que se han observado.
Sin embargo, sigue siendo controvertido si el método de Bayes jerárquico confiere una ventaja sustancial en la práctica. [42] Además, este enfoque completamente bayesiano se limita a analizar números relativamente pequeños de secuencias o taxones porque el espacio de todos los árboles posibles se vuelve rápidamente demasiado vasto, lo que hace que sea computacionalmente inviable que las muestras de cadenas converjan en una cantidad de tiempo razonable.
Calibración
La reconstrucción ancestral puede ser informada por los estados observados en muestras históricas de edad conocida, como fósiles o especímenes de archivo. Dado que la precisión de la reconstrucción ancestral generalmente decae con el paso del tiempo, el uso de tales muestras proporciona datos que están más cerca de los ancestros que se están reconstruyendo y muy probablemente mejorarán el análisis, especialmente cuando las tasas de cambio de carácter varían con el tiempo. Este concepto ha sido validado por un estudio evolutivo experimental en el que se propagaron poblaciones replicadas del bacteriófago T7 para generar una filogenia artificial. [43] Al revisar estos datos experimentales, Oakley y Cunningham [44] encontraron que los métodos de máxima parsimonia eran incapaces de reconstruir con precisión el estado ancestral conocido de un carácter continuo ( tamaño de placa ); estos resultados fueron verificados mediante simulación por computadora. Este fracaso de la reconstrucción ancestral se atribuyó a un sesgo direccional en la evolución del tamaño de la placa (de diámetros de placa grandes a pequeños) que requirió la inclusión de muestras "fosilizadas" para abordar.
Los estudios tanto de mamíferos carnívoros [45] como de peces [46] han demostrado que sin incorporar datos fósiles, las estimaciones reconstruidas de los tamaños corporales ancestrales son irrealmente grandes. Además, Graham Slater y sus colegas demostraron [47] utilizando carnívoros caniformes que la incorporación de datos fósiles en distribuciones previas mejoró tanto la inferencia bayesiana de estados ancestrales como la selección del modelo evolutivo, en relación con los análisis que utilizan sólo datos contemporáneos.
Modelos
Se han desarrollado muchos modelos para estimar estados ancestrales de caracteres discretos y continuos de descendientes existentes. [48] Estos modelos asumen que la evolución de un rasgo a lo largo del tiempo puede modelarse como un proceso estocástico. Para rasgos de valor discreto (como "tipo de polinizador"), este proceso se considera típicamente como una cadena de Markov ; para los rasgos de valor continuo (como el " tamaño del cerebro "), el proceso se considera con frecuencia un movimiento browniano o un proceso de Ornstein-Uhlenbeck . Usando este modelo como base para la inferencia estadística, ahora se pueden usar métodos de máxima verosimilitud o inferencia bayesiana para estimar los estados ancestrales.
Modelos de estado discreto
Suponga que el rasgo en cuestión puede caer en uno de estados, etiquetados . El medio típico de modelar la evolución de este rasgo es a través de una cadena de Markov de tiempo continuo, que se puede describir brevemente a continuación. Cada estado tiene asociadas tasas de transición a todos los demás estados. El rasgo se modela como un paso entre losestados; cuando alcanza un estado dado, inicia un "reloj" exponencial para cada uno de los otros estados a los que puede pasar. Luego "compite" los relojes entre sí, y da un paso hacia el estado cuyo reloj es el primero en sonar. En tal modelo, los parámetros son las tasas de transición, que puede estimarse utilizando, por ejemplo, métodos de máxima verosimilitud, donde se maximiza sobre el conjunto de todas las configuraciones posibles de estados de los nodos ancestrales.
Para recuperar el estado de un nodo ancestral dado en la filogenia (llamar a este nodo ) por máxima verosimilitud, el procedimiento es: encontrar la estimación de máxima verosimilitud de ; luego calcule la probabilidad de cada estado posible para condicionando en ; finalmente, elija el estado ancestral que maximice esto. [23] También se puede utilizar este modelo de sustitución como base para un procedimiento de inferencia bayesiano, que consideraría la creencia posterior en el estado de un nodo ancestral dado un previo elegido por el usuario.
Debido a que tales modelos pueden tener tantos como parámetros, el sobreajuste puede ser un problema. Algunas opciones comunes que reducen el espacio de parámetros son:
- Markov -modelo de parámetro de estado 1 : este modelo es el inverso en el tiempo-contraparte estatal del modelo Jukes-Cantor . En este modelo, todas las transiciones tienen la misma tasa, independientemente de sus estados inicial y final. Algunas transiciones pueden rechazarse declarando que sus tasas son simplemente 0; este puede ser el caso, por ejemplo, si ciertos estados no se pueden alcanzar desde otros estados en una sola transición.
- Markov asimétrico -modelo de parámetro de estado 2 : en este modelo, el espacio de estado está ordenado (de modo que, por ejemplo, el estado 1 es más pequeño que el estado 2, que es más pequeño que el estado 3), y las transiciones solo pueden ocurrir entre estados adyacentes. Este modelo contiene dos parámetros y : uno para la tasa de aumento del estado (por ejemplo, 0 a 1, 1 a 2, etc.), y uno para la tasa de disminución del estado (por ejemplo, de 2 a 1, 1 a 0, etc.).
Ejemplo: modelo de extinción y especiación de estado binario
El modelo de especiación y extinción de estado binario [49] (BiSSE) es un modelo de espacio discreto que no sigue directamente el marco de los mencionados anteriormente. Permite la estimación de estados de caracteres binarios ancestrales junto con tasas de diversificación asociadas con diferentes estados de caracteres; también puede extenderse directamente a un modelo más general de estados discretos múltiples. En su forma más básica, este modelo involucra seis parámetros: dos tasas de especiación (una para cada linaje en los estados 0 y 1); de manera similar, dos tasas de extinción; y dos tasas de cambio de carácter. Este modelo permite probar hipótesis sobre las tasas de especiación / extinción / cambio de carácter, a costa de aumentar el número de parámetros.
Modelos de estado continuo
En el caso de que el rasgo tome valores no discretos, se debe recurrir a un modelo en el que el rasgo evoluciona como un proceso continuo. La inferencia de estados ancestrales por máxima verosimilitud (o por métodos bayesianos) procedería como antes, pero con las probabilidades de transiciones de estado entre nodos adyacentes dadas por alguna otra distribución de probabilidad continua.
- Movimiento browniano : en este caso, si los nodos y son adyacentes en la filogenia (digamos es el antepasado de ) y separados por una rama de longitud , la probabilidad de una transición de estar en estado a estar en estado viene dada por una densidad gaussiana con media y varianza En este caso, solo hay un parámetro (), y el modelo asume que el rasgo evoluciona libremente sin un sesgo hacia el aumento o la disminución, y que la tasa de cambio es constante en todas las ramas del árbol filogenético. [50]
- Proceso de Ornstein-Uhlenbeck : en resumen, un proceso de Ornstein-Uhlenbeck es un proceso estocástico continuo que se comporta como un movimiento browniano, pero atraído hacia algún valor central, donde la fuerza de la atracción aumenta con la distancia a ese valor. [51] [52] [53] Esto es útil para modelar escenarios donde el rasgo está sujeto a una selección estabilizadora alrededor de un cierto valor (digamos). Bajo este modelo, la transición descrita anteriormente de estar en estado a estar en estado tendría una probabilidad definida por la densidad de transición de un proceso de Ornstein-Uhlenbeck con dos parámetros: , que describe la varianza del movimiento browniano impulsor, y , que describe la fuerza de su atracción por . Como tiende a , el proceso está cada vez menos limitado por su atracción por y el proceso se convierte en un movimiento browniano. Debido a esto, los modelos pueden estar anidados, y se pueden realizar pruebas de razón logarítmica de verosimilitud para discernir cuál de los dos modelos es apropiado. [50]
- Modelos estables de evolución continua del carácter: [54] aunque el movimiento browniano es atractivo y manejable como modelo de evolución continua, no permite la no neutralidad en su forma básica, ni proporciona ninguna variación en la tasa de evolución a lo largo del tiempo. . En su lugar, se puede utilizar un proceso estable , uno cuyos valores en momentos fijos se distribuyen como distribuciones estables , para modelar la evolución de los rasgos. Los procesos estables, a grandes rasgos, se comportan como movimientos brownianos que también incorporan saltos discontinuos. Esto permite modelar adecuadamente escenarios en los que se esperan breves ráfagas de evolución rápida de rasgos. En este contexto, los métodos de máxima verosimilitud no son adecuados debido a una superficie de probabilidad rugosa y porque la probabilidad puede hacerse arbitrariamente grande, por lo que los métodos bayesianos son más apropiados. [54]
Aplicaciones
Evolución del personaje
La reconstrucción ancestral se usa ampliamente para inferir los rasgos ecológicos, fenotípicos o biogeográficos asociados con los nodos ancestrales en un árbol filogenético. Todos los métodos de reconstrucción de rasgos ancestrales tienen dificultades, ya que utilizan modelos matemáticos para predecir cómo han cambiado los rasgos con grandes cantidades de datos faltantes. Estos datos faltantes incluyen los estados de especies extintas, las tasas relativas de cambios evolutivos, el conocimiento de los estados de carácter inicial y la precisión de los árboles filogenéticos. En todos los casos en los que se utiliza la reconstrucción de rasgos ancestrales, los hallazgos deben justificarse con un examen de los datos biológicos que respalden las conclusiones basadas en modelos. Griffith OW y col. [55]
La reconstrucción ancestral permite el estudio de las vías evolutivas, la selección adaptativa , la expresión génica del desarrollo [56] [57] y la divergencia funcional del pasado evolutivo. Para una revisión de las técnicas biológicas y computacionales de reconstrucción ancestral, ver Chang et al. . [58] Para la crítica de los métodos de cálculo de reconstrucción ancestral, ver Williams PD et al. . [13]
Evolución del comportamiento y la historia de vida
En los lagartos cornudos (género Phrynosoma ), la viviparidad (nacimiento vivo) ha evolucionado varias veces, basándose en métodos de reconstrucción ancestrales. [59]
Reconstrucción de la dieta en pinzones de Galápagos
Se dispone de datos filogenéticos y de carácter para la radiación de los pinzones que habitan en las Islas Galápagos . Estos datos permiten probar hipótesis sobre el tiempo y el orden de los cambios de estado de carácter a través del tiempo a través de la reconstrucción del estado ancestral. Durante la estación seca, las dietas de las 13 especies de pinzones de Galápagos pueden clasificarse en tres amplias categorías de dietas, primero las que consumen alimentos parecidos a granos se consideran " granívoros ", las que ingieren artrópodos se denominan " insectívoros " y las que consumen la vegetación se clasifica como " folívoros ". [23] La reconstrucción del estado ancestral de la dieta utilizando la máxima parsimonia recupera 2 cambios importantes de un estado insectívoro: uno a granívoro y otro a folívoro. La reconstrucción del estado ancestral de máxima probabilidad recupera resultados ampliamente similares, con una diferencia significativa: el ancestro común de los clados de pinzón de árbol ( Camarhynchus ) y pinzón de tierra ( Geospiza ) es muy probablemente granívoro en lugar de insectívoro (a juzgar por la parsimonia). En este caso, esta diferencia entre los estados ancestrales devueltos por la máxima parsimonia y la máxima probabilidad probablemente se produzca como resultado del hecho de que las estimaciones de ML consideran las longitudes de las ramas del árbol filogenético. [23]
Evolución del carácter morfológico y fisiológico
Los lagartos frinosomátidos muestran una notable diversidad morfológica, incluso en la composición relativa del tipo de fibra muscular en los músculos de las patas traseras . La reconstrucción de los antepasados basada en la parsimonia de cambio al cuadrado (equivalente a la probabilidad máxima en la evolución del carácter de movimiento browniano [60] ) indica que los lagartos cornudos , uno de los tres subclades principales del linaje, han experimentado un aumento evolutivo importante en la proporción de oxidación rápida. fibras glicolíticas en sus músculos iliofibularis. [61]
Masa corporal de mamíferos
En un análisis de la masa corporal de 1.679 especies de mamíferos placentarios comparando modelos estables de evolución de carácter continuo con modelos de movimiento browniano , Elliot y Mooers [54] demostraron que el proceso evolutivo que describe la evolución de la masa corporal de mamíferos se caracteriza mejor por un modelo estable de carácter continuo. evolución, que da cabida a cambios raros de gran magnitud. Bajo un modelo estable, los mamíferos ancestrales retuvieron una masa corporal baja a través de la diversificación temprana, con grandes aumentos en la masa corporal coincidiendo con el origen de varios órdenes de especies de gran masa corporal (por ejemplo, ungulados). Por el contrario, la simulación bajo un modelo de movimiento browniano recuperó una masa corporal mayor en un orden de magnitud menos realista entre los mamíferos ancestrales, requiriendo reducciones significativas en el tamaño corporal antes de la evolución de Órdenes que exhiben un tamaño corporal pequeño (por ejemplo, Rodentia ). Por tanto, los modelos estables recuperan una imagen más realista de la evolución de la masa corporal de los mamíferos al permitir que se produzcan grandes transformaciones en un pequeño subconjunto de ramas. [54]
Los métodos comparativos filogenéticos (inferencias extraídas mediante la comparación de taxones relacionados) se utilizan a menudo para identificar características biológicas que no evolucionan de forma independiente, lo que puede revelar una dependencia subyacente. Por ejemplo, la evolución de la forma del pico de un pinzón puede estar asociada con su comportamiento de búsqueda de alimento. Sin embargo, no es aconsejable buscar estas asociaciones mediante la comparación directa de medidas o secuencias genéticas porque estas observaciones no son independientes debido a su descendencia de ancestros comunes. Para los caracteres discretos, este problema se abordó primero en el marco de la máxima parsimonia evaluando si dos caracteres tendían a sufrir un cambio en las mismas ramas del árbol. [62] [63] Felsenstein identificó este problema para la evolución continua del carácter y propuso una solución similar a la reconstrucción ancestral, en la que la estructura filogenética de los datos se acomoda estadísticamente dirigiendo el análisis a través del cálculo de "contrastes independientes" entre los nodos del árbol. relacionados por ramas no superpuestas. [28]
Evolución molecular
A nivel molecular, los residuos de aminoácidos en diferentes ubicaciones de una proteína pueden evolucionar de forma no independiente porque tienen una interacción fisicoquímica directa, o indirectamente por sus interacciones con un sustrato común o mediante interacciones de largo alcance en la estructura de la proteína. Por el contrario, la estructura plegada de una proteína podría inferirse potencialmente de la distribución de interacciones de residuos. [64] Una de las primeras aplicaciones de la reconstrucción ancestral, para predecir la estructura tridimensional de una proteína a través de contactos de residuos, fue publicada por Shindyalov y sus colegas. [65] Las filogenias que relacionan 67 familias de proteínas diferentes se generaron mediante un método de agrupación basado en la distancia ( método de grupos de pares no ponderados con media aritmética , UPGMA), y las secuencias ancestrales se reconstruyeron por parsimonia. Los autores informaron de una tendencia débil pero significativa de que los pares de residuos en evolución conjunta se ubiquen conjuntamente en la estructura tridimensional conocida de las proteínas.
La reconstrucción de secuencias de ADN y proteínas antiguas se ha convertido sólo recientemente en un importante esfuerzo científico. El desarrollo de extensas bases de datos de secuencias genómicas junto con los avances en biotecnología y métodos de inferencia filogenética han hecho que la reconstrucción ancestral sea barata, rápida y científicamente práctica. Este concepto se ha aplicado para identificar residuos co-evolutivos en secuencias de proteínas utilizando métodos más avanzados para la reconstrucción de filogenias y secuencias ancestrales. Por ejemplo, la reconstrucción ancestral se ha utilizado para identificar residuos co-evolutivos en proteínas codificadas por genomas de virus ARN, particularmente en VIH. [66] [67] [68]
La reconstrucción de proteínas y ADN ancestrales permite la recreación de la evolución de proteínas y ADN en el laboratorio para que pueda estudiarse directamente. [58] Con respecto a las proteínas, esto permite investigar la evolución de la estructura y función molecular actual. Además, la reconstrucción de proteínas ancestrales puede conducir al descubrimiento de nuevas funciones bioquímicas que se han perdido en las proteínas modernas. [69] [70] También permite conocer la biología y la ecología de los organismos extintos. [71] Aunque la mayoría de las reconstrucciones ancestrales se han ocupado de proteínas, también se ha utilizado para probar mecanismos evolutivos a nivel de genomas bacterianos [72] y secuencias de genes de primates. [73]
Diseño de vacuna
Los virus de ARN, como el virus de la inmunodeficiencia humana (VIH), evolucionan a un ritmo extremadamente rápido, órdenes de magnitud más rápido que los mamíferos o las aves. Para estos organismos, la reconstrucción ancestral se puede aplicar en una escala de tiempo mucho más corta; por ejemplo, para reconstruir el progenitor global o regional de una epidemia que ha durado décadas en lugar de millones de años. Un equipo alrededor de Brian Gaschen propuso [74] que tales cepas reconstruidas se utilicen como objetivos para los esfuerzos de diseño de vacunas , a diferencia de las secuencias aisladas de pacientes en la actualidad. Debido a que el VIH es extremadamente diverso, una vacuna diseñada para funcionar en la población viral de un paciente podría no funcionar para un paciente diferente, porque la distancia evolutiva entre estos dos virus puede ser grande. Sin embargo, su antepasado común más reciente está más cerca de cada uno de los dos virus que entre sí. Por lo tanto, una vacuna diseñada para un ancestro común podría tener más posibilidades de ser eficaz para una mayor proporción de cepas circulantes. Otro equipo llevó esta idea más allá al desarrollar un método de reconstrucción del centro del árbol para producir una secuencia cuya distancia evolutiva total a las cepas contemporáneas es lo más pequeña posible. [75] Estrictamente hablando, este método no fue una reconstrucción ancestral , ya que la secuencia del centro del árbol (COT) no necesariamente representa una secuencia que haya existido alguna vez en la historia evolutiva del virus. Sin embargo, Rolland y sus colegas encontraron que, en el caso del VIH, el virus COT era funcional cuando se sintetizaba. Experimentos similares con secuencias ancestrales sintéticas obtenidas por reconstrucción de máxima verosimilitud también han demostrado que estos ancestros son tanto funcionales como inmunogénicos, [76] [77] dando cierta credibilidad a estos métodos. Además, la reconstrucción ancestral puede potencialmente usarse para inferir la secuencia genética de las variantes del VIH transmitido que han pasado a establecer la próxima infección, con el objetivo de identificar características distintivas de estas variantes (como una selección no aleatoria de la población transmitida de virus) que pueden ser el objetivo del diseño de vacunas. [78]
Reordenamientos del genoma
En lugar de inferir la secuencia de ADN ancestral, uno puede estar interesado en la estructura molecular y el contenido a mayor escala de un genoma ancestral. Este problema a menudo se aborda en un marco combinatorio, modelando genomas como permutaciones de genes o regiones homólogas. Se permiten varias operaciones en estas permutaciones, como una inversión (un segmento de la permutación se invierte en el lugar), la eliminación (se quita un segmento), la transposición (se quita un segmento de una parte de la permutación y se empalma en otra parte ), o la obtención de contenido genético mediante recombinación , duplicación o transferencia horizontal de genes . El "problema de reordenamiento del genoma", planteado por primera vez por Watterson y sus colegas, [17] pregunta: dados dos genomas (permutaciones) y un conjunto de operaciones permitidas, ¿cuál es la secuencia de operaciones más corta que transformará un genoma en otro? Una generalización de este problema aplicable a la reconstrucción ancestral es el "problema de reordenamiento del genoma múltiple": [79] dado un conjunto de genomas y un conjunto de operaciones permitidas, encuentre (i) un árbol binario con los genomas dados como sus hojas, y ( ii) una asignación de genomas a los nodos internos del árbol, de modo que se minimice el número total de operaciones en todo el árbol. Este enfoque es similar a la parsimonia, excepto que el árbol se infiere junto con las secuencias ancestrales. Desafortunadamente, incluso el problema del reordenamiento del genoma único es NP-difícil , [80] aunque ha recibido mucha atención en matemáticas e informática (para una revisión, ver Fertin et al. [81] ).
La reconstrucción de genomas ancestrales también se llama reconstrucción de cariotipo . La pintura cromosómica es actualmente la principal técnica experimental. [82] [83] Recientemente, los investigadores han desarrollado métodos computacionales para reconstruir el cariotipo ancestral aprovechando la genómica comparativa . [84] [85] Además, la genómica comparativa y la reconstrucción del genoma ancestral se han aplicado para identificar eventos de transferencia de genes horizontales antiguos en el último ancestro común de un linaje (por ejemplo, Candidatus Accumulibacter phosphatis [86] ) para identificar la base evolutiva para la adquisición de rasgos.
Aplicaciones espaciales
Migración
La reconstrucción ancestral no se limita a los rasgos biológicos. La ubicación espacial también es un rasgo, y los métodos de reconstrucción ancestral pueden inferir la ubicación de los ancestros de los individuos en consideración. Lemey et al. [16] utilizaron estas técnicas para rastrear geográficamente los ancestros de 192 cepas de influenza aviar A-H5N1 muestreadas en veinte localidades de Europa y Asia, y para 101 secuencias del virus de la rabia muestreadas en doce países africanos.
Tratar las ubicaciones como estados discretos (países, ciudades, etc.) permite la aplicación de los modelos de estados discretos descritos anteriormente. Sin embargo, a diferencia de un modelo en el que el espacio de estados para el rasgo es pequeño, puede haber muchas ubicaciones y las transiciones entre ciertos pares de estados pueden ocurrir raramente o nunca; por ejemplo, es posible que la migración entre lugares distantes nunca ocurra directamente si no existen viajes aéreos entre los dos lugares, por lo que dichas migraciones deben pasar primero por lugares intermedios. Esto significa que podría haber muchos parámetros en el modelo que son cero o cercanos a cero. Con este fin, Lemey y sus colegas utilizaron un procedimiento bayesiano no solo para estimar los parámetros y estados ancestrales, sino también para seleccionar qué parámetros de migración no son cero; su trabajo sugiere que este procedimiento conduce a un uso más eficiente de los datos. También exploran el uso de distribuciones previas que incorporan estructuras geográficas o hipótesis sobre la dinámica de la migración, y encuentran que las que consideraron tuvieron poco efecto en los hallazgos.
Utilizando este análisis, el equipo de Lemey descubrió que el centro de difusión más probable de A-H5N1 es Guangdong , y Hong Kong también recibe apoyo posterior. Además, sus resultados apoyan la hipótesis de una presencia prolongada de rabia africana en África occidental .
Rangos de especies
Inferir patrones biogeográficos históricos a menudo requiere reconstruir rangos ancestrales de especies en árboles filogenéticos. [87] Por ejemplo, se utilizó una filogenia bien resuelta de especies de plantas del género Cyrtandra [87] junto con información de sus rangos geográficos para comparar cuatro métodos de reconstrucción del rango ancestral. El equipo comparó la parsimonia de Fitch, [20] (FP; parsimonia) mapeo estocástico [88] (SM; máxima verosimilitud), análisis de dispersión-vicarianza [89] (DIVA; parsimonia) y dispersión-extinción-cladogénesis [15] [90 ] (DEC; máxima verosimilitud). Los resultados indicaron que ambos métodos de parsimonia funcionaron mal, lo que probablemente se debió al hecho de que los métodos de parsimonia no consideran la longitud de las ramas. Ambos métodos de máxima verosimilitud funcionaron mejor; sin embargo, los análisis de DEC que además permiten la incorporación de antecedentes geológicos dieron inferencias más realistas sobre la evolución del rango en Cyrtandra en relación con otros métodos. [87]
Otro método de máxima verosimilitud recupera la historia filogeográfica de un gen [91] mediante la reconstrucción de las ubicaciones ancestrales de los taxones muestreados. Este método asume un modelo de migración de caminata aleatoria espacialmente explícita para reconstruir ubicaciones ancestrales dadas las coordenadas geográficas de los individuos representados por las puntas del árbol filogenético. Cuando se aplicó a un árbol filogenético de ranas coro Pseudacris feriarum , este método recuperó la expansión reciente hacia el norte, una mayor distancia de dispersión por generación en la región recientemente colonizada, una ubicación ancestral no central y migración direccional. [91]
Sturtevant y Dobzhansky presentaron la primera consideración del problema de la reordenación del genoma múltiple, mucho antes de su formalización en términos de permutaciones, en 1936. [92] Examinaron los genomas de varias cepas de moscas de la fruta de diferentes ubicaciones geográficas y observaron que una configuración , que llamaron "estándar", fue el más común en todas las áreas estudiadas. Sorprendentemente, también notaron que se podían obtener cuatro cepas diferentes de la secuencia estándar mediante una sola inversión, y otras dos podrían estar relacionadas mediante una segunda inversión. Esto les permitió plantear la hipótesis de una filogenia para las secuencias e inferir que la secuencia estándar probablemente también era la ancestral.
Evolución lingüística
Las reconstrucciones de las palabras y los fenómenos de los antiguos protolenguajes , como el protoindoeuropeo, se han realizado basándose en los análogos observados en los idiomas actuales. Normalmente, estos análisis se llevan a cabo manualmente utilizando el "método comparativo". [93] En primer lugar, las palabras de diferentes idiomas con una etimología común ( cognados ) se identifican en los idiomas contemporáneos en estudio, de forma análoga a la identificación de secuencias biológicas ortólogas . En segundo lugar, se identifican las correspondencias entre los sonidos individuales en los cognados, un paso similar al alineamiento de la secuencia biológica , aunque se realiza manualmente. Finalmente, los sonidos ancestrales probables se plantean como hipótesis mediante inspección manual y varias heurísticas (como el hecho de que la mayoría de los idiomas tienen vocales nasales y no nasales ). [93]
Software
Hay muchos paquetes de software disponibles que pueden realizar la reconstrucción de estados ancestrales. Generalmente, estos paquetes de software se han desarrollado y mantenido gracias a los esfuerzos de científicos en campos relacionados y se han lanzado bajo licencias de software libre . La siguiente tabla no pretende ser un desglose completo de todos los paquetes disponibles, pero proporciona una muestra representativa de la amplia variedad de paquetes que implementan métodos de reconstrucción ancestral con diferentes fortalezas y características.
Nombre | Métodos | Plataforma | Entradas | ! Tipos de caracteres | Caracteres continuos (C) o discretos (D) | Licencia de software |
---|---|---|---|---|---|---|
PAML | Máxima verosimilitud | Unix, Mac, Win | PHYLIP, NEXUS, FASTA | Nucleótido, proteína | D | Licencia pública general GNU , versión 3 |
BESTIA | Bayesiano | Unix, Mac, Win | NEXO, BESTIA XML | Nucleótido, proteína, geográfico | CD | Licencia pública general reducida GNU |
fitool | Máxima verosimilitud | Unix, Mac, Win | newick, nexus | Rasgos cualitativos y cuantitativos | CD | Licencia pública general GNU |
MONO | Máxima verosimilitud | Unix, Mac, Win | NEXO, FASTA, CLUSTAL | Nucleótido, proteína | CD | Licencia pública general GNU |
Diversitree | Máxima verosimilitud | Unix, Mac, Win | NEXO | Rasgos cualitativos y cuantitativos, Geográficos | CD | Licencia pública general GNU, versión 2 |
HyPhy | Máxima verosimilitud | Unix, Mac, Win | MEGA, NEXUS, FASTA, PHYLIP | Nucleótido, proteína (personalizable) | D | Licencia de documentación libre GNU 1.3 |
Rasgos de Bayes | Bayesiano | Unix, Mac, Win | TSV o tabla delimitada por espacios. Las filas son especies, las columnas son rasgos. | Rasgos cualitativos y cuantitativos | CD | Licencia de atribución de Creative Commons |
Lagrange | Máxima verosimilitud | Linux, Mac, Win | TSV / CSV de regiones de especies. Las filas son especies y las columnas son regiones geográficas | Geográfico | - | Licencia pública general GNU, versión 2 |
Mezquite | Parsimonia, máxima probabilidad | Unix, Mac, Win | Fasta, NBRF, Genbank, PHYLIP, CLUSTAL, TSV | Nucleótido, proteína, geográfico | CD | Licencia Creative Commons Attribution 3.0 |
Phylomapper | Probabilidad máxima, bayesiano (a partir de la versión 2) | Unix, Mac, Win | NEXO | Nicho geográfico, ecológico | CD | - |
Antepasados | Máxima verosimilitud | Web | Fasta | Nucleótido (indeles) | D | - |
Phyrex | Parsimonia máxima | Linux | Fasta | La expresion genica | CD | Propiedad |
SIMMAP | Mapeo estocástico | Mac | Formato similar a XML | Nucleótido, rasgos cualitativos | D | Propiedad |
MrBayes | Bayesiano | Unix, Mac, Win | NEXO | Nucleótido, proteína | D | Licencia pública general GNU |
PARANA | Parsimonia máxima | Unix, Mac, Win | Newick | Redes biológicas | D | Licencia Apache |
PHAST (PREQUEL) | Máxima verosimilitud | Unix, Mac, Win | Alineación múltiple | Nucleótido | D | Licencia BSD |
RASPAR | Máxima probabilidad, bayesiano | Unix, Mac, Win | Newick | Geográfico | D | - |
VIP | Parsimonia máxima | Linux, ganar | Newick | Geográfico | D (cuadrícula) | GPL Creative Commons |
FastML | Máxima verosimilitud | Web, Unix | Fasta | Nucleótido, proteína | D | Derechos de autor |
MLGO | Máxima verosimilitud | Web | Personalizado | Permutación del orden de los genes | D | ÑU |
TEJÓN | Bayesiano | Unix, Mac, Win | Personalizado | Permutación del orden de los genes | D | GNU GPL versión 2 |
CONTAR | Parsimonia máxima, máxima probabilidad | Unix, Mac, Win | Archivo de texto delimitado por tabuladores de filas para taxones y datos de recuento en columnas. | Recuento de datos (numéricos) (p. Ej., Tamaño de la familia del homólogo) | D | BSD |
MEGA | Máxima parsimonia, máxima verosimilitud. | Mac, gana | MEGA | Nucleótido, proteína | D | Propiedad |
ANGES | Parsimonia local | Unix | Personalizado | Mapas del genoma | D | Licencia pública general GNU, versión 3 |
DESCIFRAR | Máxima verosimilitud | Unix, Mac, Win | FASTA, GenBank | Nucleótido | D | Licencia pública general GNU, versión 3 |
EREM | Máxima verosimilitud. | Módulo Win, Unix, Matlab | Formato de texto personalizado para parámetros de modelo, árbol, valores de caracteres observados. | Binario | D | No se especifica ninguno, aunque el sitio indica que el software está disponible gratuitamente. |
Descripciones de paquetes
Evolución molecular
La mayoría de estos paquetes de software están diseñados para analizar datos de secuencias genéticas. Por ejemplo, PAML [94] es una colección de programas para el análisis filogenético de alineaciones de secuencias de ADN y proteínas por máxima verosimilitud. La reconstrucción ancestral se puede realizar utilizando el programa codeml . Además, LAZARUS es una colección de scripts de Python que envuelven las funciones de reconstrucción ancestrales de PAML para el procesamiento por lotes y una mayor facilidad de uso. [95] Los paquetes de software como MEGA , HyPhy y Mesquite también realizan análisis filogenéticos de datos de secuencia, pero están diseñados para ser más modulares y personalizables. HyPhy [96] implementa un método conjunto de máxima verosimilitud de reconstrucción de secuencias ancestrales [7] que puede adaptarse fácilmente para reconstruir un rango más generalizado de estados de caracteres ancestrales discretos, como ubicaciones geográficas, especificando un modelo personalizado en su lenguaje por lotes. Mesquite [97] proporciona métodos de reconstrucción de estados ancestrales para caracteres tanto discretos como continuos utilizando métodos de máxima parsimonia y máxima probabilidad. También proporciona varias herramientas de visualización para interpretar los resultados de la reconstrucción ancestral. MEGA [98] también es un sistema modular, pero pone más énfasis en la facilidad de uso que en la personalización de los análisis. A partir de la versión 5, MEGA permite al usuario reconstruir estados ancestrales utilizando la máxima parsimonia, máxima verosimilitud y métodos empíricos de Bayes. [98]
El análisis bayesiano de secuencias genéticas puede conferir mayor robustez a la especificación errónea del modelo. MrBayes [99] permite la inferencia de estados ancestrales en nodos ancestrales utilizando el enfoque bayesiano jerárquico completo. El programa PREQUEL distribuido en el paquete PHAST [100] realiza genómica evolutiva comparativa utilizando la reconstrucción de secuencias ancestrales. SIMMAP [101] mapea estocásticamente mutaciones en filogenias. BayesTraits [31] analiza caracteres discretos o continuos en un marco bayesiano para evaluar modelos de evolución, reconstruir estados ancestrales y detectar la evolución correlacionada entre pares de rasgos.
Otros tipos de personajes
Otros paquetes de software están más orientados al análisis de rasgos cualitativos y cuantitativos ( fenotipos ). Por ejemplo, el paquete ape [102] en el entorno informático estadístico R también proporciona métodos para la reconstrucción de estados ancestrales para caracteres tanto discretos como continuos mediante la función ' as ', incluida la máxima verosimilitud. Phyrex implementa un algoritmo basado en la máxima parsimonia para reconstruir los perfiles de expresión de genes ancestrales, además de un método de máxima probabilidad para reconstruir secuencias genéticas ancestrales (envolviendo la función baseml en PAML). [103]
Varios paquetes de software también reconstruyen la filogeografía . BEAST (Bayesian Evolutionary Analysis by Sampling Trees) [104] proporciona herramientas para reconstruir ubicaciones geográficas ancestrales a partir de secuencias observadas anotadas con datos de ubicación utilizando métodos de muestreo Bayesiano MCMC . Diversitree [105] es un paquete R que proporciona métodos para la reconstrucción de estados ancestrales bajo Mk2 (un modelo de Markov de tiempo continuo de evolución de caracteres binarios). [106] y modelos BiSSE (Especiación y extinción de estado binario). Lagrange realiza análisis sobre la reconstrucción de la evolución del rango geográfico en árboles filogenéticos. [15] Phylomapper [91] es un marco estadístico para estimar patrones históricos de flujo de genes y ubicaciones geográficas ancestrales. RASP [107] infiere estados ancestrales usando análisis estadístico de dispersión-vicariancia, métodos de Lagrange, Bayes-Lagrange, BayArea y BBM. VIP [108] infiere una biogeografía histórica examinando distribuciones geográficas disyuntivas.
Los reordenamientos del genoma proporcionan información valiosa en genómica comparativa entre especies. ANGES [109] compara genomas relacionados existentes mediante la reconstrucción ancestral de marcadores genéticos. BADGER [110] utiliza un enfoque bayesiano para examinar la historia del reordenamiento de genes. Count [111] reconstruye la evolución del tamaño de las familias de genes. EREM [112] analiza la ganancia y pérdida de características genéticas codificadas por caracteres binarios. PARANA [113] realiza inferencias basadas en parsimonia de redes biológicas ancestrales que representan la pérdida y duplicación de genes.
aplicaciones web
Finalmente, existen varias aplicaciones basadas en servidor web que permiten a los investigadores utilizar métodos de máxima probabilidad para la reconstrucción ancestral de diferentes tipos de caracteres sin tener que instalar ningún software. Por ejemplo, Ancestors [114] es un servidor web para la reconstrucción del genoma ancestral mediante la identificación y disposición de regiones sinténicas . FastML [115] es un servidor web para la reconstrucción probabilística de secuencias ancestrales por máxima verosimilitud que utiliza un modelo de caracteres de brecha para reconstruir la variación indel . MLGO [116] es un servidor web para análisis de orden de genes de máxima verosimilitud.
Direcciones futuras
El desarrollo y la aplicación de algoritmos computacionales para la reconstrucción ancestral sigue siendo un área activa de investigación en todas las disciplinas. Por ejemplo, la reconstrucción de inserciones y deleciones de secuencias (indels) se ha quedado atrás de la aplicación más sencilla de modelos de sustitución. Bouchard-Côté y Jordan describieron recientemente un nuevo modelo (el Proceso Poisson Indel) [117] que representa un avance importante en el modelo arquetípico Thorne-Kishino-Felsenstein de evolución indel. [118] Además, el campo está siendo impulsado por los rápidos avances en el área de la tecnología de secuenciación de próxima generación , donde las secuencias se generan a partir de millones de moldes de ácido nucleico mediante una extensa paralelización de reacciones de secuenciación en un aparato personalizado. Estos avances han hecho posible generar una instantánea "profunda" de la composición genética de una población en rápida evolución, como los virus de ARN [119] o las células tumorales [120] en un período de tiempo relativamente corto. Al mismo tiempo, la enorme cantidad de datos y los perfiles de error de secuenciación específicos de la plataforma han creado nuevos desafíos bioinformáticos para procesar estos datos para la reconstrucción de secuencias ancestrales.
Ver también
- Biología evolucionaria
- Origen de la vida
- Promiscuidad enzimática
Referencias
Este artículo fue adaptado de la siguiente fuente bajo una licencia CC BY 4.0 ( 2015 ) ( informes de los revisores ): Jeffrey B Joy; Richard H Liang; Rosemary M McCloskey; T Nguyen; Art Poon (12 de julio de 2016). "Reconstrucción ancestral" . PLOS Biología Computacional . 12 (7): e1004763. doi : 10.1371 / JOURNAL.PCBI.1004763 . ISSN 1553-734X . PMC 4942178 . PMID 27404731 . Wikidata Q28596371 .
- ^ a b Omland, Kevin E. (1999). "Los supuestos y desafíos de las reconstrucciones estatales ancestrales" . Biología sistemática . 48 (3): 604–611. doi : 10.1080 / 106351599260175 . ISSN 1063-5157 .
- ^ Cai, Wei; Pei, Jimin; Grishin, Nick V (2004). "Reconstrucción de secuencias de proteínas ancestrales y sus aplicaciones" . Biología Evolutiva BMC . 4 (1): 33. doi : 10.1186 / 1471-2148-4-33 . ISSN 1471-2148 . PMC 522809 . PMID 15377393 .
- ^ Platnick, Norman I .; Cameron, H. Don (1977). "Métodos cladísticos en análisis textual, lingüístico y filogenético". Zoología sistemática . 26 (4): 380. doi : 10.2307 / 2412794 . ISSN 0039-7989 . JSTOR 2412794 .
- ^ Bentley, R. Alexander; Teherán, Jamshid J. (2013). "La filogenia de Caperucita Roja" . PLOS ONE . 8 (11): e78871. Código bibliográfico : 2013PLoSO ... 878871T . doi : 10.1371 / journal.pone.0078871 . ISSN 1932-6203 . PMC 3827309 . PMID 24236061 .
- ^ Michalak, Pawel; Walker, Robert S .; Hill, Kim R .; Flinn, Mark V .; Ellsworth, Ryan M. (2011). "Historia evolutiva de las prácticas matrimoniales de cazadores-recolectores" . PLOS ONE . 6 (4): e19066. Código bibliográfico : 2011PLoSO ... 619066W . doi : 10.1371 / journal.pone.0019066 . ISSN 1932-6203 . PMC 3083418 . PMID 21556360 .
- ^ Brooks, Daniel R (1999). "Filogenias y el método comparativo en el comportamiento animal, editado por Emı Emia P. Martins, Oxford University Press, 1996. X + 415 pp". Procesos conductuales . 47 (2): 135-136. doi : 10.1016 / S0376-6357 (99) 00038-8 . ISBN 978-0-19-509210-3. ISSN 0376-6357 . PMID 24896936 . S2CID 9872907 .
- ^ a b c Pupko, T .; Pe, I .; Shamir, R .; Graur, D. (2000). "Un algoritmo rápido para la reconstrucción conjunta de secuencias de aminoácidos ancestrales". Biología Molecular y Evolución . 17 (6): 890–896. doi : 10.1093 / oxfordjournals.molbev.a026369 . ISSN 0737-4038 . PMID 10833195 .
- ^ a b c Pagel, Mark; Meade, Andrew; Barker, Daniel (2004). "Estimación bayesiana de estados de carácter ancestral en filogenias" . Biología sistemática . 53 (5): 673–684. doi : 10.1080 / 10635150490522232 . ISSN 1063-5157 . PMID 15545248 .
- ^ Sanger, F .; Thompson, EOP; Kitai, Ruth (1955). "Los grupos amida de la insulina" . Revista bioquímica . 59 (3): 509–518. doi : 10.1042 / bj0590509 . ISSN 0264-6021 . PMC 1216278 . PMID 14363129 .
- ^ Pauling, Linus; Zuckerkandl, Emile; Henriksen, Thormod; Lövstad, Rolf (1963). "Paleogenética química." Estudios de restauración "moleculares de formas de vida extintas" . Acta Chemica Scandinavica . 17 supl .: 9-16. doi : 10.3891 / acta.chem.scand.17s-0009 . ISSN 0904-213X .
- ^ a b Dobzhansky, Theodosius; Sturtevant, Alfred (1938). "Inversiones en los cromosomas de Drosophila pseudoobscura" . Genética . 23 (1): 28–64. doi : 10.1093 / genetics / 23.1.28 . PMC 1209001 . PMID 17246876 .
- ^ Harms, Michael J; Thornton, Joseph W. (2010). "Análisis de la estructura y función de las proteínas mediante la reconstrucción de genes ancestrales" . Opinión actual en biología estructural . 20 (3): 360–366. doi : 10.1016 / j.sbi.2010.03.005 . ISSN 0959-440X . PMC 2916957 . PMID 20413295 .
- ^ a b c d Williams, Paul D .; Pollock, David D .; Blackburne, Benjamin P .; Goldstein, Richard A. (2006). "Evaluación de la precisión de los métodos de reconstrucción de proteínas ancestrales" . PLOS Biología Computacional . 2 (6): e69. Código Bibliográfico : 2006PLSCB ... 2 ... 69W . doi : 10.1371 / journal.pcbi.0020069 . ISSN 1553-734X . PMC 1480538 . PMID 16789817 .
- ^ Ronquist, F (2004). "Inferencia bayesiana de la evolución del carácter". Tendencias en Ecología y Evolución . 19 (9): 475–481. doi : 10.1016 / j.tree.2004.07.002 . ISSN 0169-5347 . PMID 16701310 .
- ^ a b c Ree, RH; Smith, SA (2008). "Inferencia de máxima verosimilitud de la evolución del rango geográfico por dispersión, extinción local y cladogénesis" . Biología sistemática . 57 (1): 4–14. doi : 10.1080 / 10635150701883881 . ISSN 1063-5157 . PMID 18253896 .
- ^ a b Fraser, Christophe; Lemey, Philippe; Rambaut, Andrew; Drummond, Alexei J .; Suchard, Marc A. (2009). "La filogeografía bayesiana encuentra sus raíces" . PLOS Biología Computacional . 5 (9): e1000520. Código Bibliográfico : 2009PLSCB ... 5E0520L . doi : 10.1371 / journal.pcbi.1000520 . ISSN 1553-7358 . PMC 2740835 . PMID 19779555 .
- ^ a b Watterson, GA; Ewens, WJ; Hall, TE; Morgan, A. (1982). "El problema de la inversión cromosómica". Revista de Biología Teórica . 99 (1): 1–7. doi : 10.1016 / 0022-5193 (82) 90384-8 . ISSN 0022-5193 .
- ^ Tuffley, Chris; Acero, Mike (1997). "Vínculos entre máxima verosimilitud y máxima parsimonia bajo un modelo simple de sustitución de sitio". Boletín de Biología Matemática . 59 (3): 581–607. doi : 10.1007 / BF02459467 . ISSN 0092-8240 . PMID 9172826 . S2CID 189885872 .
- ^ Swofford, David L .; Maddison, Wayne P. (1987). "Reconstrucción de estados de carácter ancestral bajo la parsimonia de Wagner". Biociencias matemáticas . 87 (2): 199–229. doi : 10.1016 / 0025-5564 (87) 90074-5 . ISSN 0025-5564 .
- ^ a b Fitch, Walter M. (1971). "Hacia la definición del curso de la evolución: cambio mínimo para una topología de árbol específica". Zoología sistemática . 20 (4): 406–416. doi : 10.2307 / 2412116 . ISSN 0039-7989 . JSTOR 2412116 .
- ^ Stamatakis, A. (2006). "RAxML-VI-HPC: análisis filogenéticos basados en máxima verosimilitud con miles de taxones y modelos mixtos" (PDF) . Bioinformática . 22 (21): 2688–2690. doi : 10.1093 / bioinformatics / btl446 . ISSN 1367-4803 . PMID 16928733 .
- ^ Sankoff, David (1975). "Árboles de secuencia mínima de mutación". Revista SIAM de Matemática Aplicada . 28 (1): 35–42. CiteSeerX 10.1.1.665.9596 . doi : 10.1137 / 0128004 . ISSN 0036-1399 .
- ^ a b c d e Schluter, Dolph; Price, Trevor; Mooers, Arne O .; Ludwig, Donald (1997). "Probabilidad de estados antepasados en radiación adaptativa". Evolución . 51 (6): 1699-1711. doi : 10.2307 / 2410994 . ISSN 0014-3820 . JSTOR 2410994 . PMID 28565128 .
- ^ Felsenstein, Joseph (1973). "Métodos de máxima verosimilitud y pasos mínimos para estimar árboles evolutivos a partir de datos sobre caracteres discretos". Zoología sistemática . 22 (3): 240–249. doi : 10.2307 / 2412304 . ISSN 0039-7989 . JSTOR 2412304 .
- ^ a b c Cunningham, Clifford W .; Omland, Kevin E .; Oakley, Todd H. (1998). "Reconstrucción de estados de carácter ancestral: una reevaluación crítica". Tendencias en Ecología y Evolución . 13 (9): 361–366. doi : 10.1016 / S0169-5347 (98) 01382-2 . ISSN 0169-5347 . PMID 21238344 .
- ^ Schluter, Arne O. Mooers, Dolph (1999). "Reconstrucción de estados ancestrales con máxima probabilidad: soporte para modelos de una y dos tasas". Biología sistemática . 48 (3): 623–633. CiteSeerX 10.1.1.594.175 . doi : 10.1080 / 106351599260193 . ISSN 1063-5157 .
- ^ Li, Guoliang; Steel, Mike; Zhang, Louxin (2008). "Más taxones no son necesariamente mejores para la reconstrucción de estados de carácter ancestral". Biología sistemática . 57 (4): 647–653. arXiv : 0803.0195 . doi : 10.1080 / 10635150802203898 . ISSN 1063-5157 . PMID 18709600 . S2CID 1373201 .
- ^ a b Felsenstein, Joseph (1985). "Filogenias y el método comparativo". El naturalista estadounidense . 125 (1): 1-15. doi : 10.1086 / 284325 . ISSN 0003-0147 . S2CID 9731499 .
- ^ a b c d Yang, Ziheng; Kumar, Sudhir; Nei, Masatoshi (1995). "Un nuevo método de inferencia de secuencias de aminoácidos y nucleótidos ancestrales" . Genética . 141 (4): 1641–50. doi : 10.1093 / genetics / 141.4.1641 . PMC 1206894 . PMID 8601501 .
- ^ Koshi, Jeffrey M .; Goldstein, Richard A. (1996). "Reconstrucción probabilística de secuencias de proteínas ancestrales". Revista de evolución molecular . 42 (2): 313–320. Código bibliográfico : 1996JMolE..42..313K . CiteSeerX 10.1.1.1031.2646 . doi : 10.1007 / BF02198858 . ISSN 0022-2844 . PMID 8919883 . S2CID 15997589 .
- ^ a b Pagel, Mark (1999). "El enfoque de máxima probabilidad para reconstruir estados de carácter ancestral de caracteres discretos en filogenias" . Biología sistemática . 48 (3): 612–622. doi : 10.1080 / 106351599260184 . ISSN 1063-5157 .
- ^ Guindon, Stéphane; Gascuel, Olivier (2003). "Un algoritmo simple, rápido y preciso para estimar grandes filogenias por máxima probabilidad" . Biología sistemática . 52 (5): 696–704. doi : 10.1080 / 10635150390235520 . ISSN 1063-5157 . PMID 14530136 .
- ^ Doornik, Jurgen A .; Ooms, Marius (2003). "Aspectos computacionales de la estimación de máxima verosimilitud de modelos de media móvil fraccionalmente integrados autorregresivos" . Estadística computacional y análisis de datos . 42 (3): 333–348. doi : 10.1016 / S0167-9473 (02) 00212-8 . ISSN 0167-9473 .
- ^ a b Felsenstein, Joseph (1981). "Árboles evolutivos de secuencias de ADN: un enfoque de máxima verosimilitud". Revista de evolución molecular . 17 (6): 368–376. Código bibliográfico : 1981JMolE..17..368F . doi : 10.1007 / BF01734359 . ISSN 0022-2844 . PMID 7288891 . S2CID 8024924 .
- ^ Eyre-Walker, Adam (1998). "Problemas con la parsimonia en secuencias de composición de base sesgada". Revista de evolución molecular . 47 (6): 686–690. Código bibliográfico : 1998JMolE..47..686E . doi : 10.1007 / PL00006427 . ISSN 0022-2844 . PMID 9847410 . S2CID 26128712 .
- ^ Pupko, T .; Pe'er, I .; Hasegawa, M .; Graur, D .; Friedman, N. (2002). "Un algoritmo de ramificación y unión para la inferencia de secuencias de aminoácidos ancestrales cuando la tasa de reemplazo varía entre sitios: aplicación a la evolución de cinco familias de genes" . Bioinformática . 18 (8): 1116–1123. doi : 10.1093 / bioinformatics / 18.8.1116 . ISSN 1367-4803 . PMID 12176835 .
- ^ Gruenheit, N .; Lockhart, PJ; Acero, M .; Martin, W. (2008). "Dificultades en la prueba de propiedades de secuencias similares a covariones bajo la influencia confusa de proporciones cambiantes de sitios variables" (PDF) . Biología Molecular y Evolución . 25 (7): 1512-1520. doi : 10.1093 / molbev / msn098 . ISSN 0737-4038 . PMID 18424773 .
- ^ Huelsenbeck, JP; Ronquist, F. (2001). "MRBAYES: inferencia bayesiana de árboles filogenéticos" . Bioinformática . 17 (8): 754–755. doi : 10.1093 / bioinformatics / 17.8.754 . ISSN 1367-4803 . PMID 11524383 .
- ^ Yang, Ziheng (1997). "PAML: un paquete de programas para el análisis filogenético por máxima verosimilitud" . Bioinformática . 13 (5): 555–556. doi : 10.1093 / bioinformatics / 13.5.555 . ISSN 1367-4803 . PMID 9367129 .
- ^ a b Huelsenbeck, John P .; Bollback, Jonathan P. (2001). "Estimación bayesiana empírica y jerárquica de estados ancestrales". Biología sistemática . 50 (3): 351–366. CiteSeerX 10.1.1.319.4271 . doi : 10.1080 / 106351501300317978 . ISSN 1076-836X . PMID 12116580 .
- ^ Lutzoni, François; Pagel, Mark; Reeb, Valérie (2001). "Los principales linajes de hongos se derivan de ancestros simbióticos de líquenes". Naturaleza . 411 (6840): 937–940. Código Bibliográfico : 2001Natur.411..937L . doi : 10.1038 / 35082053 . ISSN 0028-0836 . PMID 11418855 . S2CID 4414913 .
- ^ Hanson-Smith, V .; Kolaczkowski, B .; Thornton, JW (2010). "Robustez de la reconstrucción de la secuencia ancestral a la incertidumbre filogenética" . Biología Molecular y Evolución . 27 (9): 1988–1999. doi : 10.1093 / molbev / msq081 . ISSN 0737-4038 . PMC 2922618 . PMID 20368266 .
- ^ Hillis, D .; Bull, J .; White, M .; Badgett, M .; Molineux, I. (1992). "Filogenia experimental: generación de una filogenia conocida". Ciencia . 255 (5044): 589–592. Código Bibliográfico : 1992Sci ... 255..589H . doi : 10.1126 / science.1736360 . ISSN 0036-8075 . PMID 1736360 .
- ^ Oakley, Todd H .; Cunningham, Clifford W. (2000). "Los contrastes independientes tienen éxito donde falla la reconstrucción de ancestros en una filogenia de bacteriófagos conocida". Evolución . 54 (2): 397–405. doi : 10.1554 / 0014-3820 (2000) 054 [0397: ICSWAR] 2.0.CO; 2 . ISSN 0014-3820 . PMID 10937216 .
- ^ Finarelli, John A .; Flynn, John J. (2006). "Reconstrucción del estado ancestral del tamaño corporal en Caniformia (Carnivora, Mammalia): los efectos de incorporar datos del registro fósil". Biología sistemática . 55 (2): 301–313. doi : 10.1080 / 10635150500541698 . ISSN 1063-5157 . PMID 16611601 .
- ^ Albert, James S .; Johnson, Derek M .; Knouft, Jason H. (2009). "Los fósiles proporcionan mejores estimaciones del tamaño corporal ancestral que los taxones existentes en los peces". Acta Zoologica . 90 : 357–384. doi : 10.1111 / j.1463-6395.2008.00364.x . ISSN 0001-7272 .
- ^ Slater, Graham J .; Harmon, Luke J .; Alfaro, Michael E. (2012). "La integración de fósiles con filogenias moleculares mejora la inferencia de la evolución del rasgo" . Evolución . 66 (12): 3931–3944. doi : 10.1111 / j.1558-5646.2012.01723.x . ISSN 0014-3820 . PMID 23206147 . S2CID 24390146 .
- ^ Webster, AJ; Purvis, A. (2002). "Prueba de la precisión de los métodos para la reconstrucción de estados ancestrales de caracteres continuos" . Actas de la Royal Society B: Ciencias Biológicas . 269 (1487): 143-149. doi : 10.1098 / rspb.2001.1873 . ISSN 0962-8452 . PMC 1690869 . PMID 11798429 .
- ^ Maddison, Wayne; Midford, Peter; Otto, Sarah (2007). "Estimación del efecto de un carácter binario sobre la especiación y la extinción" . Biología sistemática . 56 (5): 701–710. doi : 10.1080 / 10635150701607033 . ISSN 1063-5157 . PMID 17849325 .
- ^ a b Martins, Emilia P (1994). " ' Estimación de la tasa de evolución fenotípica a partir de datos comparativos". Naturalista estadounidense . 144 (2): 193-209. doi : 10.1086 / 285670 . S2CID 85300707 .
- ^ Felsenstein, J (1988). "Filogenias y caracteres cuantitativos". Revisión anual de ecología y sistemática . 19 : 445–471. doi : 10.1146 / annurev.ecolsys.19.1.445 .
- ^ Garland, T. Jr .; Dickerman, AW; Janis, CM; Jones, JA (1993). "Análisis filogenético de covarianza por simulación por computadora". Biología sistemática . 42 (3): 265-292. doi : 10.1093 / sysbio / 42.3.265 .
- ^ Cooper, N., GH Thomas, C. Venditti, A. Meade y RP Freckleton. 2015. Una nota de advertencia sobre el uso de modelos de Ornstein Uhlenbeck en estudios macroevolutivos. Revista Biológica de la Sociedad Linneana.
- ^ a b c d Elliot, Michael G; Mooers, Arne Ø (2014). "Inferir estados ancestrales sin asumir neutralidad o gradualismo utilizando un modelo estable de evolución continua del carácter" . Biología Evolutiva BMC . 14 (1): 226. doi : 10.1186 / s12862-014-0226-8 . ISSN 1471-2148 . PMC 4266906 . PMID 25427971 .
- ^ Griffith, Oliver W .; Blackburn, Daniel G .; Brandley, Matthew C .; Van Dyke, James U .; Whittington, Camilla M .; Thompson, Michael B. (2015). "Las reconstrucciones de estados ancestrales requieren evidencia biológica para probar hipótesis evolutivas: un estudio de caso que examina la evolución del modo reproductivo en reptiles escamosos". Revista de Zoología Experimental Parte B: Evolución Molecular y del Desarrollo . 324 (6): 493–503. doi : 10.1002 / jez.b.22614 . ISSN 1552-5007 . PMID 25732809 .
- ^ Erkenbrack, EM; Ako-Asare, K .; Miller, E .; Tekelenburg, S .; Thompson, JR; Romano, L. (2016). "Reconstrucción del estado ancestral mediante análisis comparativo de un núcleo GRN que opera en equinodermos". Genes de desarrollo y evolución . 226 (1): 37–45. doi : 10.1007 / s00427-015-0527-y . ISSN 0949-944X . PMID 26781941 . S2CID 6067524 .
- ^ Erkenbrack, EM; Thompson, JR (2019). "La filogenia de tipo celular informa el origen evolutivo de la identidad celular esqueletogénica de larvas de equinodermo" . Biología de las comunicaciones . 2 : 160. doi : 10.1038 / s42003-019-0417-3 . ISSN 2399-3642 . PMC 6499829 . PMID 31069269 .
- ^ a b Chang, Belinda SW; Ugalde, Juan A .; Matz, Mikhail V. (2005). "Aplicaciones de la reconstrucción de proteínas ancestrales en la comprensión de la función de las proteínas: proteínas similares a las GFP" . Métodos en enzimología . 395 : 652–670 . doi : 10.1016 / S0076-6879 (05) 95034-9 . ISBN 9780121828004. ISSN 0076-6879 . PMID 15865989 .
- ^ Hodges, WL (2004). "Evolución de la viviparidad en lagartos cornudos ( Phrynosoma ): probar la hipótesis del clima frío" . Revista de Biología Evolutiva . 17 (6): 1230-1237. doi : 10.1111 / j.1420-9101.2004.00770.x . PMID 15525408 . S2CID 25069395 .
- ^ Maddison, WP (1991). "Reconstrucciones de parsimonia de cambio al cuadrado de estados ancestrales para caracteres de valor continuo en un árbol filogenético". Biología sistemática . 40 (3): 304–314. doi : 10.1093 / sysbio / 40.3.304 .
- ^ Bonine, KE (2005). "Variación de tipo de fibra muscular en lagartos (Squamata) y reconstrucción filogenética de estados ancestrales hipotéticos" . Revista de Biología Experimental . 208 (23): 4529–4547. doi : 10.1242 / jeb.01903 . PMID 16339872 .
- ^ Ridley, Mark (1983). La explicación de la diversidad orgánica: el método comparativo y adaptaciones para el apareamiento . Oxford: Clarendon Press.
- ^ Maddison, Wayne P. (1990). "Un método para probar la evolución correlacionada de dos caracteres binarios: ¿las ganancias o pérdidas se concentran en ciertas ramas de un árbol filogenético?". Evolución . 44 (3): 539–557. doi : 10.2307 / 2409434 . ISSN 0014-3820 . JSTOR 2409434 . PMID 28567979 .
- ^ Göbel, Ulrike; Sander, Chris; Schneider, Reinhard; Valencia, Alfonso (1994). "Mutaciones correlacionadas y contactos de residuos en proteínas". Proteínas: estructura, función y genética . 18 (4): 309–317. doi : 10.1002 / prot.340180402 . ISSN 0887-3585 . PMID 8208723 . S2CID 14978727 .
- ^ Shindyalov, IN; Kolchanov, NA; Sander, C. (1994). "¿Pueden predecirse los contactos tridimensionales en estructuras de proteínas mediante el análisis de mutaciones correlacionadas?". Ingeniería, Diseño y Selección de Proteínas . 7 (3): 349–358. doi : 10.1093 / proteína / 7.3.349 . ISSN 1741-0126 . PMID 8177884 .
- ^ Korber, BT; Farber, RM; Wolpert, DH; Lapedes, AS (1993). "Covariación de mutaciones en el bucle V3 de la proteína de la envoltura del virus de inmunodeficiencia humana tipo 1: un análisis teórico de la información" . Actas de la Academia Nacional de Ciencias . 90 (15): 7176–7180. Código Bibliográfico : 1993PNAS ... 90.7176K . doi : 10.1073 / pnas.90.15.7176 . ISSN 0027-8424 . PMC 47099 . PMID 8346232 .
- ^ Shapiro, B. (2006). "Un método filogenético para la detección de epistasis positiva en secuencias de genes y su aplicación a la evolución del virus de ARN" . Biología Molecular y Evolución . 23 (9): 1724-1730. doi : 10.1093 / molbev / msl037 . ISSN 0737-4038 . PMID 16774976 .
- ^ Poon, Art FY; Lewis, Fraser I .; Estanque, Sergei L. Kosakovsky; Escarcha, Simon DW (2007). "Un modelo de red evolutiva revela interacciones estratificadas en el bucle V3 de la envolvente del VIH-1" . PLOS Biología Computacional . 3 (11): e231. Código bibliográfico : 2007PLSCB ... 3..231P . doi : 10.1371 / journal.pcbi.0030231 . ISSN 1553-734X . PMC 2082504 . PMID 18039027 .
- ^ Jermann, Thomas M .; Opitz, Jochen G .; Stackhouse, Joseph; Benner, Steven A. (1995). "Reconstrucción de la historia evolutiva de la superfamilia de artiodáctil ribonucleasa". Naturaleza . 374 (6517): 57–59. Código Bib : 1995Natur.374 ... 57J . doi : 10.1038 / 374057a0 . ISSN 0028-0836 . PMID 7532788 . S2CID 4315312 .
- ^ Sadqi, M .; de Alba, E .; Pérez-Jiménez, R .; Sánchez-Ruiz, JM; Muñoz, V. (2009). "Una proteína diseñada como modelo experimental de plegamiento primordial" . Actas de la Academia Nacional de Ciencias . 106 (11): 4127–4132. Código bibliográfico : 2009PNAS..106.4127S . doi : 10.1073 / pnas.0812108106 . ISSN 0027-8424 . PMC 2647338 . PMID 19240216 .
- ^ Chang, BSW; Jonsson, K .; Kazmi, MA; Donoghue, MJ; Sakmar, TP (2002). "Recreando un pigmento visual Archosaurio ancestral funcional". Biología Molecular y Evolución . 19 (9): 1483–1489. doi : 10.1093 / oxfordjournals.molbev.a004211 . ISSN 0737-4038 . PMID 12200476 .
- ^ Zhang, C .; Zhang, M .; Ju, J .; Nietfeldt, J .; Wise, J .; Terry, PM; Olson, M .; Kachman, SD; Wiedmann, M .; Samadpour, M .; Benson, AK (2003). "Diversificación del genoma en linajes filogenéticos I y II de Listeria monocytogenes: identificación de segmentos exclusivos de poblaciones de linaje II" . Revista de bacteriología . 185 (18): 5573–5584. doi : 10.1128 / JB.185.18.5573-5584.2003 . ISSN 0021-9193 . PMC 193770 . PMID 12949110 .
- ^ Krishnan, Nuevo México (2004). "Reconstrucción de la secuencia ancestral en el ADN mitocondrial de primates: sesgo composicional y efecto sobre la inferencia funcional" . Biología Molecular y Evolución . 21 (10): 1871–1883. doi : 10.1093 / molbev / msh198 . ISSN 0737-4038 . PMID 15229290 .
- ^ Gaschen, B. (2002). "Consideraciones de diversidad en la selección de la vacuna contra el VIH-1". Ciencia . 296 (5577): 2354–2360. Código Bibliográfico : 2002Sci ... 296.2354G . doi : 10.1126 / science.1070441 . ISSN 0036-8075 . PMID 12089434 . S2CID 39452987 .
- ^ Rolland, M .; Jensen, MA; Nickle, DC; Yan, J .; Aprenda, GH; Heath, L .; Weiner, D .; Mullins, JI (2007). "Reconstrucción y función de las proteínas de tipo 1 del virus de inmunodeficiencia humana del centro del árbol ancestral" . Revista de Virología . 81 (16): 8507–8514. doi : 10.1128 / JVI.02683-06 . ISSN 0022-538X . PMC 1951385 . PMID 17537854 .
- ^ Kothe, Denise L .; Li, Yingying; Decker, Julie M .; Bibollet-Ruche, Frederic; Zammit, Kenneth P .; Salazar, Maria G .; Chen, Yalu; Weng, Zhiping; Weaver, Eric A .; Gao, Feng; Haynes, Barton F .; Shaw, George M .; Korber, Bette TM; Hahn, Beatrice H. (2006). "Inmunógenos de envoltura de consenso y ancestrales para el subtipo C del VIH-1" . Virología . 352 (2): 438–449. doi : 10.1016 / j.virol.2006.05.011 . ISSN 0042-6822 . PMID 16780913 .
- ^ Mullins, JI; Haigwood, NL ; Barnett, SW; Montefiori, D .; Edmonson, PF; McLaughlin, S .; Hensel, MT; Mahalanabis, M .; Li, F. (1 de septiembre de 2005). "La proteína de envoltura ancestral del subtipo B del virus de inmunodeficiencia humana tipo 1 es funcional y provoca anticuerpos neutralizantes en conejos similares a los provocados por una envoltura de subtipo B circulante" . Revista de Virología . 79 (17): 11214–11224. doi : 10.1128 / JVI.79.17.11214-11224.2005 . ISSN 0022-538X . PMC 1193599 . PMID 16103173 .
- ^ McCloskey, RM; Liang, RH; Harrigan, PR; Brumme, ZL; Poon, AFY (2014). "Una evaluación de métodos filogenéticos para reconstruir variantes de VIH transmitidas utilizando datos de secuencia de VIH clonal longitudinal" . Revista de Virología . 88 (11): 6181–6194. doi : 10.1128 / JVI.00483-14 . ISSN 0022-538X . PMC 4093844 . PMID 24648453 .
- ^ Borque, Guillaume; Pevzner, Pavel A. (2012). "Evolución a escala del genoma: reconstrucción de órdenes de genes en las especies ancestrales" . Investigación del genoma . 12 (1): 26–36. PMC 155248 . PMID 11779828 .
- ^ Incluso, S; Goldreich, O (1981). "El problema de la secuencia del generador de longitud mínima es NP-hard". Revista de algoritmos . 2 (3): 311–313. doi : 10.1016 / 0196-6774 (81) 90029-8 . ISSN 0196-6774 .
- ^ Fertin, Guillaume; Labarre, Anthony; Rusu, Irena; Tannier, Eric; Vialette, Stéphane (2009). Combinatoria de reordenamientos del genoma . Prensa del MIT. doi : 10.7551 / mitpress / 9780262062824.001.0001 . ISBN 9780262258753.
- ^ Viena, Johannes (2004). "La evolución de los cromosomas euterios". Opinión Actual en Genética y Desarrollo . 14 (6): 657–666. doi : 10.1016 / j.gde.2004.10.001 . ISSN 0959-437X . PMID 15531161 .
- ^ Froenicke, Lutz; García Caldés, Montserrat; Graphodatsky, Alexander; Müller, Stefan; Lyons, Leslie; Robinson, Terence; Volleth, Marianne; Yang, Fengtang; Wienberg, Johannes (2006). "¿Sugieren la citogenética molecular y la bioinformática modelos divergentes de genomas ancestrales de mamíferos?" . Investigación del genoma . 16 (3): 306–310. doi : 10.1101 / gr.3955206 . ISSN 1088-9051 . PMC 1415215 . PMID 16510895 .
- ^ Murphy, WJ (2005). "Dinámica de la evolución cromosómica de mamíferos inferida de mapas comparativos de múltiples especies". Ciencia . 309 (5734): 613–617. Código bibliográfico : 2005Sci ... 309..613M . doi : 10.1126 / science.1111387 . ISSN 0036-8075 . PMID 16040707 . S2CID 32314883 .
- ^ Ma, J .; Zhang, L .; Suh, BB; Raney, BJ; Burhans, RC; Kent, WJ; Blanchette, M .; Haussler, D .; Miller, W. (2006). "Reconstrucción de regiones contiguas de un genoma ancestral" . Investigación del genoma . 16 (12): 1557-1565. doi : 10.1101 / gr.5383506 . ISSN 1088-9051 . PMC 1665639 . PMID 16983148 .
- ^ Oyserman, Ben O .; Moya, Francisco; Lawson, Christopher E .; García, Antonio L .; Vogt, Mark; Heffernen, Mitchell; Noguera, Daniel R .; McMahon, Katherine D. (29 de abril de 2016). "La reconstrucción del genoma ancestral identifica la base evolutiva para la adquisición de rasgos en bacterias acumuladoras de polifosfato" . El diario ISME . 10 (12): 2931–2945. doi : 10.1038 / ismej.2016.67 . ISSN 1751-7370 . PMC 5148189 . PMID 27128993 .
- ^ a b c Clark, John; Ree, Richard; Alfaro, Michael; Rey, Mateo; Wagner, Warren; Roalson, Eric (2008). "Un estudio comparativo en métodos de reconstrucción de rango ancestral: retrocediendo las historias inciertas de linajes insulares" . Biología sistemática . 57 (5): 693–707. doi : 10.1080 / 10635150802426473 . ISSN 1063-5157 . PMID 18853357 .
- ^ Huelsenbeck, John P .; Nielsen, Rasmus; Bollback, Jonathan P. (2003). "Mapeo estocástico de caracteres morfológicos" . Biología sistemática . 52 (2): 131-158. doi : 10.1080 / 10635150390192780 . ISSN 1063-5157 . PMID 12746144 .
- ^ Ronquist, Fredrik (1996). "DIVA versión 1.1" .
Programa de computadora y manual disponible por FTP anónimo de la Universidad de Uppsala
[ enlace muerto permanente ] - ^ Ree, Richard H .; Moore, Brian R .; Webb, Campbell O .; Donoghue, Michael J. (2005). "Un marco de probabilidad para inferir la evolución del rango geográfico en árboles filogenéticos" . Evolución . 59 (11): 2299–2311. doi : 10.1111 / j.0014-3820.2005.tb00940.x . ISSN 0014-3820 . PMID 16396171 . S2CID 23245573 .
- ^ a b c Lemmon, Alan; Lemmon, Emily Moriarty (2008). "Un marco de probabilidad para estimar la historia filogeográfica en un paisaje continuo" . Biología sistemática . 57 (4): 544–561. doi : 10.1080 / 10635150802304761 . ISSN 1063-5157 . PMID 18686193 .
- ^ a b Sturtevant, AH; Dobzhansky, T. (1936). "Inversiones en el tercer cromosoma de razas salvajes de Drosophila Pseudoobscura y su uso en el estudio de la historia de las especies" (PDF) . Actas de la Academia Nacional de Ciencias . 22 (7): 448–450. Código Bibliográfico : 1936PNAS ... 22..448S . doi : 10.1073 / pnas.22.7.448 . ISSN 0027-8424 . PMC 1076803 . PMID 16577723 .
- ^ a b Campbell, Lyle (1998). Lingüística histórica: una introducción . Edimburgo: Edinburgh University Press.
- ^ Yang, Z. (2007). "PAML 4: análisis filogenético por máxima verosimilitud". Biología Molecular y Evolución . 24 (8): 1586-1591. CiteSeerX 10.1.1.322.1650 . doi : 10.1093 / molbev / msm088 . ISSN 0737-4038 . PMID 17483113 .
- ^ "Lazarus: una herramienta de software para reconstruir secuencias de proteínas ancestrales" . markov.uoregon.edu . Archivado desde el original el 7 de marzo de 2015 . Consultado el 7 de marzo de 2019 .
- ^ Estanque, SLK; Frost, SDW; Muse, SV (2004). "HyPhy: prueba de hipótesis utilizando filogenias" . Bioinformática . 21 (5): 676–679. doi : 10.1093 / bioinformatics / bti079 . ISSN 1367-4803 . PMID 15509596 .
- ^ Maddison, WP; Maddison, RD (2015). "Mesquite: un sistema modular para análisis evolutivo. Versión 2.75" .
- ^ a b Tamura, K .; Stecher, G .; Peterson, D .; Filipski, A .; Kumar, S. (2013). "MEGA6: análisis de genética evolutiva molecular versión 6.0" . Biología Molecular y Evolución . 30 (12): 2725–2729. doi : 10.1093 / molbev / mst197 . ISSN 0737-4038 . PMC 3840312 . PMID 24132122 .
- ^ Ronquist, F .; Huelsenbeck, JP (2003). "MrBayes 3: inferencia filogenética bayesiana en modelos mixtos" . Bioinformática . 19 (12): 1572-1574. doi : 10.1093 / bioinformatics / btg180 . ISSN 1367-4803 . PMID 12912839 .
- ^ Hubisz, MJ; Pollard, KS; Siepel, A. (2010). "PHAST y RPHAST: análisis filogenético con modelos espacio / tiempo" . Sesiones informativas en bioinformática . 12 (1): 41–51. doi : 10.1093 / bib / bbq072 . ISSN 1467-5463 . PMC 3030812 . PMID 21278375 .
- ^ Bollback, Jonathan P (2006). "SIMMAP: mapeo de caracteres estocásticos de rasgos discretos en filogenias" . BMC Bioinformática . 7 (1): 88. doi : 10.1186 / 1471-2105-7-88 . ISSN 1471-2105 . PMC 1403802 . PMID 16504105 .
- ^ Paradis, Emmanuel (2012). Análisis de Phylogenetics and Evolution con R . Nueva York: Springer-Verlag.
- ^ Rossnes, Roald; Eidhammer, Ingvar; Liberles, David A (2005). "Reconstrucción filogenética de estados de caracteres ancestrales para la expresión génica y datos de empalme de ARNm" . BMC Bioinformática . 6 (1): 127. doi : 10.1186 / 1471-2105-6-127 . ISSN 1471-2105 . PMC 1166541 . PMID 15921519 .
- ^ Drummond, AJ; Suchard, MA; Xie, D .; Rambaut, A. (2012). "Filogenética Bayesiana con BEAUti y la BESTIA 1.7" . Biología Molecular y Evolución . 29 (8): 1969-1973. doi : 10.1093 / molbev / mss075 . ISSN 0737-4038 . PMC 3408070 . PMID 22367748 .
- ^ FitzJohn, Richard G. (2012). "Diversitree: análisis filogenético comparativo de diversificación en R" . Métodos en ecología y evolución . 3 (6): 1084–1092. doi : 10.1111 / j.2041-210X.2012.00234.x . ISSN 2041-210X .
- ^ Pagel, M. (1994). "Detección de la evolución correlacionada en filogenias: un método general para el análisis comparativo de caracteres discretos". Actas de la Royal Society B: Ciencias Biológicas . 255 (1342): 37–45. Código Bibliográfico : 1994RSPSB.255 ... 37P . doi : 10.1098 / rspb.1994.0006 . ISSN 0962-8452 . S2CID 85903564 .
- ^ Yu, Yan; Harris, AJ; Él, Xingjin (2010). "S-DIVA (análisis estadístico de dispersión-vicariancia): una herramienta para inferir historias biogeográficas". Filogenética molecular y evolución . 56 (2): 848–850. doi : 10.1016 / j.ympev.2010.04.011 . ISSN 1055-7903 . PMID 20399277 .
- ^ Arias, J. Salvador; Szumik, Claudia A .; Goloboff, Pablo A. (2011). "Análisis espacial de la vicarianza: un método para utilizar información geográfica directa en biogeografía histórica". Cladística . 27 (6): 617–628. doi : 10.1111 / j.1096-0031.2011.00353.x . ISSN 0748-3007 . S2CID 85747431 .
- ^ Jones, BR; Rajaraman, A .; Tannier, E .; Chauve, C. (2012). "ANGES: reconstrucción de mapas de genes ancestrales" . Bioinformática . 28 (18): 2388–2390. doi : 10.1093 / bioinformatics / bts457 . ISSN 1367-4803 . PMID 22820205 .
- ^ Larget, Bret; Kadane, Joseph B .; Simon, Donald L. (2005). "Un enfoque bayesiano para la estimación de los arreglos del genoma ancestral". Filogenética molecular y evolución . 36 (2): 214-223. doi : 10.1016 / j.ympev.2005.03.026 . ISSN 1055-7903 . PMID 15893477 .
- ^ Csuos, M. (2010). "Recuento: análisis evolutivo de perfiles filogenéticos con parsimonia y verosimilitud". Bioinformática . 26 (15): 1910-1912. doi : 10.1093 / bioinformática / btq315 . ISSN 1367-4803 . PMID 20551134 .
- ^ Carmel, Liran; Wolf, Yuri I .; Rogozin, Igor B .; Koonin, Eugene V. (2010). "EREM: estimación de parámetros y reconstrucción ancestral por algoritmo de maximización de expectativas para un modelo probabilístico de evolución de caracteres binarios genómicos" . Avances en bioinformática . 2010 : 1–4. doi : 10.1155 / 2010/167408 . ISSN 1687-8027 . PMC 2866244 . PMID 20467467 .
- ^ Patro, Rob; Sefer, Emre; Malin, Justin; Marçais, Guillaume; Navlakha, Saket; Kingsford, Carl (2012). "Reconstrucción parsimoniosa de la evolución de la red" . Algoritmos de Biología Molecular . 7 (1): 25. doi : 10.1186 / 1748-7188-7-25 . ISSN 1748-7188 . PMC 3492119 . PMID 22992218 .
- ^ Diallo, AB; Makarenkov, V .; Blanchette, M. (2009). "Ancestors 1.0: un servidor web para la reconstrucción de secuencias ancestrales" . Bioinformática . 26 (1): 130-131. doi : 10.1093 / bioinformatics / btp600 . ISSN 1367-4803 . PMID 19850756 .
- ^ Ashkenazy, H .; Penn, O .; Doron-Faigenboim, A .; Cohen, O .; Cannarozzi, G .; Zomer, O .; Pupko, T. (2012). "FastML: un servidor web para la reconstrucción probabilística de secuencias ancestrales" . Investigación de ácidos nucleicos . 40 (W1): W580 – W584. doi : 10.1093 / nar / gks498 . ISSN 0305-1048 . PMC 3394241 . PMID 22661579 .
- ^ Hu, Fei; Lin, Yu; Tang, Jijun (2014). "MLGO: reconstrucción de filogenia e inferencia ancestral a partir de datos de orden de genes" . BMC Bioinformática . 15 (1): 354. doi : 10.1186 / s12859-014-0354-6 . ISSN 1471-2105 . PMC 4236499 . PMID 25376663 .
- ^ Bouchard-Cote, A .; Jordan, MI (2012). "Inferencia evolutiva a través del proceso de Poisson Indel" . Actas de la Academia Nacional de Ciencias . 110 (4): 1160-1166. arXiv : 1207.6327 . Código bibliográfico : 2013PNAS..110.1160B . doi : 10.1073 / pnas.1220450110 . ISSN 0027-8424 . PMC 3557041 . PMID 23275296 .
- ^ Thorne, Jeffrey L .; Kishino, Hirohisa; Felsenstein, Joseph (1991). "Un modelo evolutivo para la alineación de máxima probabilidad de secuencias de ADN". Revista de evolución molecular . 33 (2): 114-124. Código bibliográfico : 1991JMolE..33..114T . doi : 10.1007 / BF02193625 . ISSN 0022-2844 . PMID 1920447 . S2CID 13333056 .
- ^ Fraser, Christophe; Poon, Art FY; Swenson, Luke C .; Bunnik, Evelien M .; Edo-Matas, Diana; Schuitemaker, Hanneke ; van 't Wout, Angélique B .; Harrigan, P. Richard (2012). "Reconstrucción de la dinámica de la evolución del VIH en hosts a partir de datos de secuencia profunda en serie" . PLOS Biología Computacional . 8 (11): e1002753. Código bibliográfico : 2012PLSCB ... 8E2753P . doi : 10.1371 / journal.pcbi.1002753 . ISSN 1553-7358 . PMC 3486858 . PMID 23133358 .
- ^ Beerenwinkel, Niko ; Schwarz, Roland F .; Trinh, Anne; Sipos, Botond; Brenton, James D .; Goldman, Nick; Markowetz, Florian (2014). "Cuantificación filogenética de heterogeneidad intratumoral" . PLOS Biología Computacional . 10 (4): e1003535. arXiv : 1306.1685 . Código bibliográfico : 2014PLSCB..10E3535S . doi : 10.1371 / journal.pcbi.1003535 . ISSN 1553-7358 . PMC 3990475 . PMID 24743184 .