Máxima parsimonia (filogenética)


En filogenética , la parsimonia máxima es un criterio de optimalidad bajo el cual se prefiere el árbol filogenético que minimiza el número total de cambios de estado de carácter. Bajo el criterio de máxima parsimonia, el árbol óptimo minimizará la cantidad de homoplasia (es decir, evolución convergente , evolución paralela y reversiones evolutivas ). En otras palabras, bajo este criterio, se considera mejor el árbol más corto posible que explique los datos. Algunas de las ideas básicas detrás de la máxima parsimonia fueron presentadas por James S. Farris [1] en 1970 y Walter M. Fitch en 1971.[2]

La máxima parsimonia es un criterio intuitivo y sencillo, y por ello es popular. Sin embargo, aunque es fácil puntuar un árbol filogenético (contando el número de cambios de estado de carácter), no existe un algoritmo para generar rápidamente el árbol más parsimonioso. En cambio, el árbol más parsimonioso debe encontrarse en el "espacio del árbol" (es decir, entre todos los árboles posibles). Para un pequeño número de taxones (es decir, menos de nueve) es posible hacer una búsqueda exhaustiva , en la que se puntúan todos los árboles posibles y se selecciona el mejor. En el caso de nueve a veinte taxones, generalmente será preferible utilizar ramificación y encuadernación , que también garantiza la obtención del mejor árbol. Para un mayor número de taxones, una búsqueda heurística se debe realizar.

Debido a que el árbol más parsimonioso es siempre el árbol más corto posible, esto significa que, en comparación con el árbol "verdadero" que realmente describe la historia evolutiva de los organismos en estudio, el "mejor" árbol de acuerdo con el criterio de máxima parsimonia será a menudo subestiman el cambio evolutivo real que se ha producido. Además, la parsimonia máxima no es estadísticamente consistente. Es decir, no está garantizado producir el árbol verdadero con alta probabilidad, dados suficientes datos. Como demostró Joe Felsenstein en 1978 , [3] la parsimonia máxima puede ser inconsistente bajo ciertas condiciones, como la atracción de rama larga. Por supuesto, cualquier algoritmo filogenético también podría ser estadísticamente inconsistente si el modelo que emplea para estimar el árbol preferido no coincide con precisión con la forma en que ocurrió la evolución en ese clado. Esto es incognoscible. Por lo tanto, si bien la consistencia estadística es una propiedad teórica interesante, se encuentra fuera del ámbito de la comprobabilidad y es irrelevante para los estudios filogenéticos empíricos. [4]

En filogenética, la parsimonia se interpreta principalmente en el sentido de favorecer los árboles que minimizan la cantidad de cambio evolutivo requerido (ver por ejemplo [2] ). Alternativamente, la parsimonia filogenética se puede caracterizar por favorecer los árboles que maximizan el poder explicativo al minimizar el número de similitudes observadas que no pueden explicarse por herencia y descendencia común. [5] [6] La minimización del cambio evolutivo requerido por un lado y la maximización de las similitudes observadas que pueden explicarse como homología por el otro pueden resultar en árboles preferidos diferentes cuando algunas características observadas no son aplicables en algunos grupos que están incluidos en el tree, y este último puede verse como el enfoque más general. [7] [8] [9]

Si bien la evolución no es un proceso inherentemente parsimonioso, siglos de experiencia científica apoyan el principio de parsimonia antes mencionado ( navaja de Occam ). Es decir, la suposición de una cadena de eventos más simple y parsimoniosa es preferible a la suposición de una cadena de eventos más complicada y menos parsimoniosa. Por lo tanto, la parsimonia ( sensu lato ) se busca típicamente en la construcción de árboles filogenéticos y, en general, en la explicación científica. [10]


Un ejemplo de atracción de rama larga . Si las ramas A y C tienen un alto número de sustituciones en el "árbol verdadero" (asumido, nunca conocido en realidad excepto en simulaciones), entonces la parsimonia podría interpretar los cambios paralelos como sinapomorfias y el grupo A y C juntos.