De Wikipedia, la enciclopedia libre
Ir a navegaciónSaltar a buscar

Se han propuesto varios modelos de Markov diferentes de evolución de secuencias de ADN . Estos modelos de sustitución difieren en términos de los parámetros utilizados para describir las velocidades a las que un nucleótido reemplaza a otro durante la evolución. Estos modelos se utilizan con frecuencia en análisis filogenéticos moleculares . En particular, se utilizan durante el cálculo de la probabilidad de un árbol (en enfoques bayesianos y de máxima verosimilitud para la estimación de árboles) y se utilizan para estimar la distancia evolutiva entre secuencias a partir de las diferencias observadas entre las secuencias.

Introducción

Estos modelos son descripciones fenomenológicas de la evolución del ADN como una cadena de cuatro estados discretos. Estos modelos de Markov no describen explícitamente el mecanismo de mutación ni la acción de la selección natural. Más bien describen las tasas relativas de diferentes cambios. Por ejemplo, los sesgos mutacionales y la selección purificadora que favorece los cambios conservadores son probablemente responsables de la tasa relativamente alta de transiciones en comparación con las transversiones en secuencias en evolución. Sin embargo, el modelo de Kimura (K80) que se describe a continuación solo intenta capturar el efecto de ambas fuerzas en un parámetro que refleja la tasa relativa de transiciones a transversiones.

Los análisis evolutivos de secuencias se llevan a cabo en una amplia variedad de escalas de tiempo. Por lo tanto, es conveniente expresar estos modelos en términos de las tasas de cambio instantáneas entre diferentes estados (las matrices Q a continuación). Si se nos da un estado inicial (ancestral) en una posición, la matriz Q del modelo y una longitud de rama que expresa el número esperado de cambios que han ocurrido desde el ancestro, entonces podemos derivar la probabilidad de que la secuencia descendiente tenga cada uno de los cuatro estados. Los detalles matemáticos de esta transformación de matriz de tasas a matriz de probabilidad se describen en la sección de matemáticas de los modelos de sustitución del modelo de sustitución.página. Al expresar los modelos en términos de tasas de cambio instantáneas, podemos evitar estimar un gran número de parámetros para cada rama en un árbol filogenético (o cada comparación si el análisis implica muchas comparaciones de secuencias por pares).

Los modelos descritos en esta página describen la evolución de un solo sitio dentro de un conjunto de secuencias. A menudo se utilizan para analizar la evolución de un locus completo al hacer la suposición simplificadora de que los diferentes sitios evolucionan de forma independiente y están distribuidos de manera idéntica . Esta suposición puede estar justificada si se puede suponer que los sitios evolucionan de manera neutral . Si el efecto principal de la selección natural en la evolución de las secuencias es restringir algunos sitios, entonces se pueden usar modelos de heterogeneidad de velocidad entre sitios. Este enfoque permite estimar solo una matriz de tasas relativas de sustitución y otro conjunto de parámetros que describen la varianza en la tasa total de sustitución entre sitios.

La evolución del ADN como una cadena de Markov en tiempo continuo

Cadenas de Markov de tiempo continuo

Las cadenas de Markov de tiempo continuo tienen las matrices de transición habituales que, además, están parametrizadas por tiempo,. Específicamente, si son los estados, entonces la matriz de transición

donde cada entrada individual, se refiere a la probabilidad de que el estado cambiará a estado a tiempo .

Ejemplo: Nos gustaría modelar el proceso de sustitución en secuencias de ADN ( es decir, Jukes-Cantor , Kimura, etc. ) de forma continua. Las matrices de transición correspondientes se verán así:

donde los bloques de 2 × 2 de arriba a la izquierda y de abajo a la derecha corresponden a las probabilidades de transición y los bloques de 2 × 2 de arriba a la derecha y de abajo a la izquierda corresponden a las probabilidades de transversión .

Supuesto: si en algún momento, la cadena de Markov está en estado , entonces la probabilidad de que en el momento , estará en estado depende solo de , y . Esto entonces nos permite escribir esa probabilidad como.

Teorema: Las matrices de transición en tiempo continuo satisfacen:

Nota: Aquí existe una posible confusión entre dos significados de la palabra transición . (i) En el contexto de las cadenas de Markov , transición es el término general para el cambio entre dos estados. (ii) En el contexto de los cambios de nucleótidos en las secuencias de ADN , transición es un término específico para el intercambio entre las dos purinas (A ↔ G) o las dos pirimidinas (C ↔ T) (para obtener más detalles, consulte el artículo sobre transiciones en genética ). Por el contrario, un intercambio entre una purina y una pirimidina se denomina transversión .

Derivando la dinámica de sustitución

Considere una secuencia de ADN de longitud fija m que evoluciona en el tiempo por reemplazo de bases. Suponga que los procesos seguidos por los m sitios son independientes de Markov, distribuidos de forma idéntica y que el proceso es constante en el tiempo. Para un sitio en particular, deje

ser el conjunto de posibles estados del sitio, y

sus respectivas probabilidades en el momento . Por dos distintos, dejar ser la tasa de transición del estado a estado . Del mismo modo, para cualquier, deje que la tasa total de cambio de ser

Los cambios en la distribución de probabilidad por pequeños incrementos de tiempo son dadas por

En otras palabras, (en lenguaje frecuentista), la frecuencia de es en el momento es igual a la frecuencia en el momento menos la frecuencia de los perdidos 's más la frecuencia de la nueva creación 's.

Similarmente para las probabilidades , y . Estas ecuaciones se pueden escribir de forma compacta como

donde

se conoce como la matriz de tasas . Tenga en cuenta que, por definición, la suma de las entradas en cada fila dees igual a cero. Resulta que

Para un proceso estacionario , dondeno depende del tiempo t , esta ecuación diferencial se puede resolver. Primero,

donde denota el exponencial de la matriz. Como resultado,

Ergodicidad

Si la cadena de Markov es irreductible , es decir , si siempre es posible pasar de un estado a un estado (posiblemente en varios pasos), entonces también es ergódico . Como resultado, tiene una distribución estacionaria única. , donde corresponde a la proporción de tiempo pasado en el estado después de que la cadena de Markov se haya ejecutado durante un período de tiempo infinito. En la evolución del ADN, bajo el supuesto de un proceso común para cada sitio, las frecuencias estacionariascorresponden a composiciones de base de equilibrio. De hecho, tenga en cuenta que, dado que la distribución estacionaria satisface , vemos que cuando la distribución actual es la distribución estacionaria tenemos

En otras palabras, las frecuencias de no cambies.

Reversibilidad del tiempo

Definición : Un proceso de Markov estacionario es reversible en el tiempo si (en el estado estacionario) la cantidad de cambio del estado para es igual a la cantidad de cambio de para , (aunque los dos estados pueden ocurrir con diferentes frecuencias). Esto significa que:

No todos los procesos estacionarios son reversibles; sin embargo, los modelos de evolución del ADN más utilizados asumen la reversibilidad en el tiempo, lo que se considera una suposición razonable.

Bajo el supuesto de reversibilidad del tiempo, dejemos , entonces es fácil ver que:

Definición El término simétricose llama intercambiabilidad entre estados y . En otras palabras, es la fracción de la frecuencia del estado que es el resultado de las transiciones de estado a estado .

Corolario Las 12 entradas fuera de la diagonal de la matriz de tasas, (tenga en cuenta que las entradas fuera de la diagonal determinan las entradas diagonales, ya que las filas de suma a cero) se puede determinar completamente mediante 9 números; estos son: 6 términos de intercambiabilidad y 3 frecuencias estacionarias, (dado que las frecuencias estacionarias suman 1).

Escalado de la longitud de las ramas

Al comparar las secuencias existentes, se puede determinar la cantidad de divergencia de secuencias. Esta medida bruta de divergencia proporciona información sobre el número de cambios que se han producido a lo largo de la ruta que separa las secuencias. El simple recuento de diferencias (la distancia de Hamming ) entre secuencias a menudo subestima el número de sustituciones debido a múltiples aciertos (ver homoplasy). Tratar de estimar el número exacto de cambios que se han producido es difícil y, por lo general, no es necesario. En cambio, las longitudes de las ramas (y las longitudes de los caminos) en los análisis filogenéticos generalmente se expresan en el número esperado de cambios por sitio. La longitud de la ruta es el producto de la duración de la ruta en el tiempo y la tasa media de sustituciones. Si bien su producto puede estimarse, la velocidad y el tiempo no se pueden identificar a partir de la divergencia de secuencia.

Las descripciones de las matrices de tasas en esta página reflejan con precisión la magnitud relativa de las diferentes sustituciones, pero estas matrices de tasas no se escalan de manera que una longitud de rama de 1 produzca un cambio esperado. Este escalado se puede lograr multiplicando cada elemento de la matriz por el mismo factor, o simplemente escalando las longitudes de las ramas. Si usamos β para denotar el factor de escala, y ν para denotar la longitud de la rama medida en el número esperado de sustituciones por sitio, entonces βν se usa en las fórmulas de probabilidad de transición a continuación en lugar de μ t . Tenga en cuenta que ν es un parámetro que debe estimarse a partir de los datos y se denomina longitud de la rama, mientras que β es simplemente un número que se puede calcular a partir de la matriz de tasas (no es un parámetro libre separado).

El valor de β se puede encontrar forzando la tasa esperada de flujo de estados a 1. Las entradas diagonales de la matriz de tasas (la matriz Q ) representan -1 veces la tasa de salida de cada estado. Para los modelos reversibles en el tiempo , conocemos las frecuencias del estado de equilibrio (estas son simplemente el valor del parámetro π i para el estado i ). Por lo tanto, podemos encontrar la tasa de cambio esperada calculando la suma del flujo de cada estado ponderado por la proporción de sitios que se espera que estén en esa clase. Establecer β como el recíproco de esta suma garantizará que el proceso escalado tenga un flujo esperado de 1:

Por ejemplo, en Jukes-Cantor, el factor de escala sería 4 / (3μ) porque la tasa de abandono de cada estado es 3μ / 4 .

Modelos más comunes de evolución del ADN

Modelo JC69 (Jukes y Cantor 1969)

JC69, el modelo de Jukes y Cantor 1969, [1] es el modelo de sustitución más simple . Hay varios supuestos. Asume frecuencias de base igualesy tasas de mutación iguales . Por tanto, el único parámetro de este modelo es, la tasa de sustitución global. Como se mencionó anteriormente, esta variable se convierte en una constante cuando normalizamos la tasa media a 1.

Probabilidad de cambiar del estado inicial al estado final en función de la longitud de la rama () para JC69. Curva roja: estados de nucleótidos y son diferentes. Curva azul: los estados inicial y final son iguales. Después de mucho tiempo, las probabilidades tienden a las frecuencias de equilibrio de nucleótidos (0,25: línea discontinua).

Cuando la longitud de la rama, , se mide en el número esperado de cambios por sitio, luego:

Vale la pena notar que lo que representa la suma de cualquier columna (o fila) de la matriz multiplicado por el tiempo y, por lo tanto, significa el número esperado de sustituciones en el tiempo (duración de la rama) para cada sitio en particular (por sitio) cuando la tasa de sustitución es igual .

Dada la proporción de sitios que difieren entre las dos secuencias, la estimación de Jukes-Cantor de la distancia evolutiva (en términos del número esperado de cambios) entre dos secuencias viene dada por

El en esta fórmula se refiere con frecuencia como el -distancia. Es una estadística suficiente para calcular la corrección de la distancia Jukes-Cantor, pero no es suficiente para el cálculo de la distancia evolutiva en los modelos más complejos que siguen (tenga en cuenta también que utilizado en fórmulas posteriores no es idéntico al "-distancia").

Modelo K80 (Kimura 1980)

K80, el modelo de Kimura de 1980, [2] a menudo denominado modelo de dos parámetros de Kimura (o el modelo K2P ), distingue entre transiciones (, es decir, de purina a purina, o , es decir, de pirimidina a pirimidina) y transversiones (de purina a pirimidina o viceversa). En la descripción original de Kimura del modelo, α y β se usaron para denotar las tasas de estos tipos de sustituciones, pero ahora es más común establecer la tasa de transversiones en 1 y usar κ para denotar la relación de transición / tasa de transversión (como se hace a continuación). El modelo K80 asume que todas las bases son igualmente frecuentes ().

Matriz de tarifas con columnas correspondientes a , , , y , respectivamente.

La distancia de dos parámetros de Kimura viene dada por:

donde p es la proporción de sitios que muestran diferencias transicionales yq es la proporción de sitios que muestran diferencias transversales.

Modelo K81 (Kimura 1981)

K81, el modelo de Kimura 1981, [3] a menudo llamado modelo de tres parámetros de Kimura ( modelo K3P) o modelo de tres tipos de sustitución de Kimura (K3ST), tiene distintas tasas de transiciones y dos tipos distintos de transversiones . Los dos tipos de transversión son aquellos que conservan las propiedades débiles / fuertes de los nucleótidos (es decir, y , denotado por el símbolo [3] ) y aquellos que conservan las propiedades amino / ceto de los nucleótidos (es decir, y , denotado por el símbolo [3] ). El modelo K81 supone que todas las frecuencias base de equilibrio son iguales (es decir,).

Matriz de tarifas con columnas correspondientes a , , , y , respectivamente.

El modelo K81 se usa con mucha menos frecuencia que el modelo K80 (K2P) para la estimación de distancias y rara vez es el modelo que mejor se ajusta en la filogenia de máxima verosimilitud. A pesar de estos hechos, el modelo K81 se ha seguido estudiando en el contexto de la filogenética matemática. [4] [5] [6] Una propiedad importante es la capacidad de realizar una transformación de Hadamard asumiendo que los patrones del sitio se generaron en un árbol con nucleótidos evolucionando bajo el modelo K81. [7] [8] [9]

Cuando se usa en el contexto de la filogenética, la transformada de Hadamard proporciona un medio elegante y completamente invertible para calcular las frecuencias esperadas del patrón de sitio dado un conjunto de longitudes de rama (o viceversa). A diferencia de muchos cálculos de máxima verosimilitud, los valores relativos para, , y puede variar entre las ramas y la transformación de Hadamard puede incluso proporcionar evidencia de que los datos no se ajustan a un árbol. La transformada de Hadamard también se puede combinar con una amplia variedad de métodos para acomodar la heterogeneidad de tasas entre sitios, [10] utilizando distribuciones continuas en lugar de las aproximaciones discretas típicamente utilizadas en la filogenética de máxima verosimilitud [11] (aunque uno debe sacrificar la invertibilidad de la Transformada de Hadamard para usar ciertas distribuciones de heterogeneidad de tasas entre sitios [10] ).

Modelo F81 (Felsenstein 1981)

F81, el modelo 1981 de Felsenstein , [12] es una extensión del modelo JC69 en el que se permite que las frecuencias base varíen de 0,25 ()

Matriz de tarifas:

Cuando la longitud de la rama, ν, se mide en el número esperado de cambios por sitio, entonces:

Modelo HKY85 (Hasegawa, Kishino y Yano 1985)

Se puede pensar que HKY85, el modelo Hasegawa, Kishino y Yano 1985, [13] combina las extensiones hechas en los modelos Kimura80 y Felsenstein81. Es decir, distingue entre la tasa de transiciones y las transversiones (usando el parámetro κ) y permite frecuencias de base desiguales (). [Felsenstein describió un modelo similar (pero no equivalente) en 1984 utilizando una parametrización diferente; [14] este último modelo se conoce como modelo F84. [15] ]

Matriz de tarifas

Si expresamos la longitud de la rama, ν en términos del número esperado de cambios por sitio, entonces:

y la fórmula para las otras combinaciones de estados se puede obtener sustituyendo en las frecuencias de base apropiadas.

Modelo T92 (Tamura 1992)

T92, el modelo Tamura 1992, [16] es un método matemático desarrollado para estimar el número de sustituciones de nucleótidos por sitio entre dos secuencias de ADN, extendiendo el método de dos parámetros de Kimura (1980) al caso donde existe un sesgo de contenido G + C . Este método será útil cuando haya fuertes sesgos de transición-transversión y contenido de G + C, como en el caso del ADN mitocondrial de Drosophila . [dieciséis]

T92 implica un único parámetro de frecuencia base compuesto (también anotado )

Como T92 se hace eco de la segunda regla de paridad de Chargaff (los nucleótidos emparejados tienen la misma frecuencia en una sola hebra de ADN, G y C por un lado, y A y T por otro lado) se deduce que las cuatro frecuencias de base se pueden expresar como una función de

y

Matriz de tarifas

La distancia evolutiva entre dos secuencias de ADN según este modelo viene dada por

donde y es el contenido de G + C ().

Modelo TN93 (Tamura y Nei 1993)

TN93, el modelo de Tamura y Nei 1993, [17] distingue entre los dos tipos diferentes de transición ; es decir () puede tener una tasa diferente a (). Se supone que todas las transversiones ocurren a la misma tasa, pero se permite que esa tasa sea diferente de ambas tasas para las transiciones.

TN93 también permite frecuencias base desiguales ().

Matriz de tarifas

Modelo GTR (Tavaré 1986)

GTR, el modelo generalizado reversible en el tiempo de Tavaré 1986, [18] es el modelo más general neutral, independiente, de sitios finitos y reversible en el tiempo posible. Fue descrito por primera vez en forma general por Simon Tavaré en 1986. [18]

Los parámetros GTR consisten en un vector de frecuencia base de equilibrio, , dando la frecuencia a la que ocurre cada base en cada sitio, y la matriz de tasas

Donde

son los parámetros de la tasa de transición.

Por lo tanto, GTR (para cuatro caracteres, como suele ser el caso en filogenética) requiere 6 parámetros de tasa de sustitución, así como 4 parámetros de frecuencia base de equilibrio. Sin embargo, esto generalmente se elimina hasta 9 parámetros más, el número total de sustituciones por unidad de tiempo. Al medir el tiempo en sustituciones (= 1) solo quedan 8 parámetros libres.

En general, para calcular el número de parámetros, se debe contar el número de entradas por encima de la diagonal en la matriz, es decir, para n valores de rasgos por sitio. , y luego sume n para las frecuencias base de equilibrio, y reste 1 porqueestá arreglado. Uno consigue

Por ejemplo, para una secuencia de aminoácidos (hay 20 aminoácidos "estándar" que componen las proteínas ), uno encontraría que hay 209 parámetros. Sin embargo, al estudiar las regiones codificantes del genoma, es más común trabajar con un modelo de sustitución de codones (un codón tiene tres bases y codifica un aminoácido en una proteína). Existencodones, pero se supone que las velocidades de transición entre codones que difieren en más de una base son cero. Por lo tanto, hay parámetros.

Ver también

  • Evolución molecular
  • Reloj molecular
  • UPGMA

Referencias

  1. ^ Jukes TH, Cantor CR (1969). Evolución de moléculas de proteínas . Nueva York: Academic Press. págs. 21-132.
  2. ^ Kimura M (diciembre de 1980). "Un método simple para estimar las tasas evolutivas de sustituciones de bases a través de estudios comparativos de secuencias de nucleótidos". Revista de evolución molecular . 16 (2): 111-20. Código bibliográfico : 1980JMolE..16..111K . doi : 10.1007 / BF01731581 . PMID 7463489 . S2CID 19528200 .  
  3. ↑ a b c Kimura M (enero de 1981). "Estimación de distancias evolutivas entre secuencias de nucleótidos homólogas" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 78 (1): 454–8. Código Bibliográfico : 1981PNAS ... 78..454K . doi : 10.1073 / pnas.78.1.454 . PMC 319072 . PMID 6165991 .  
  4. Bashford JD, Jarvis PD, Sumner JG, Steel MA (25 de febrero de 2004). "Simetría U (1) × U (1) × U (1) del modelo Kimura 3ST y procesos de ramificación filogenética". Revista de Física A: Matemática y General . 37 (8): L81 – L89. arXiv : q-bio / 0310037 . doi : 10.1088 / 0305-4470 / 37/8 / L01 . S2CID 7845860 . 
  5. ^ Sumner JG, Charleston MA, Jermiin LS, Jarvis PD (agosto de 2008). "Invariantes de Markov, pletismos y filogenia". Revista de Biología Teórica . 253 (3): 601-15. doi : 10.1016 / j.jtbi.2008.04.001 . PMID 18513747 . 
  6. ^ Sumner JG, Jarvis PD, Holland BR (diciembre de 2014). "Un enfoque tensorial para la inversión de modelos filogenéticos basados ​​en grupos" . Biología Evolutiva BMC . 14 (1): 236. doi : 10.1186 / s12862-014-0236-6 . PMC 4268818 . PMID 25472897 .  
  7. ^ Hendy MD, Penny D, Steel MA (abril de 1994). "Un análisis de Fourier discreto para árboles evolutivos" . Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 91 (8): 3339–43. Código Bibliográfico : 1994PNAS ... 91.3339H . doi : 10.1073 / pnas.91.8.3339 . PMC 43572 . PMID 8159749 .  
  8. ^ Hendy MD (2005). "Conjugación de Hadamard: una herramienta analítica para la filogenia" . En Gascuel O (ed.). Matemáticas de la Evolución y Filogenia . Prensa de la Universidad de Oxford. págs. 143-177. ISBN 978-0198566106.
  9. ^ Hendy MD, Snir S (julio de 2008). "Conjugación de Hadamard para el modelo Kimura 3ST: prueba combinatoria usando conjuntos de ruta". Transacciones IEEE / ACM sobre biología computacional y bioinformática . 5 (3): 461–71. doi : 10.1109 / TCBB.2007.70227 . PMID 18670048 . S2CID 20633916 .  
  10. ^ a b Waddell PJ, Penny D, Moore T (agosto de 1997). "Conjugaciones de Hadamard y evolución de secuencia de modelado con tasas desiguales entre sitios". Filogenética molecular y evolución . 8 (1): 33–50. doi : 10.1006 / mpev.1997.0405 . PMID 9242594 . 
  11. ^ Yang Z (septiembre de 1994). "Estimación filogenética de máxima verosimilitud a partir de secuencias de ADN con tasas variables sobre sitios: métodos aproximados". Revista de evolución molecular . 39 (3): 306-14. Código bibliográfico : 1994JMolE..39..306Y . CiteSeerX 10.1.1.305.951 . doi : 10.1007 / BF00160154 . PMID 7932792 . S2CID 17911050 .   
  12. ^ Felsenstein J (1981). "Árboles evolutivos de secuencias de ADN: un enfoque de máxima verosimilitud". Revista de evolución molecular . 17 (6): 368–76. Código bibliográfico : 1981JMolE..17..368F . doi : 10.1007 / BF01734359 . PMID 7288891 . S2CID 8024924 .  
  13. ^ Hasegawa M, Kishino H, Yano T (1985). "Datación de la división humano-simio por un reloj molecular de ADN mitocondrial". Revista de evolución molecular . 22 (2): 160–74. Código bibliográfico : 1985JMolE..22..160H . doi : 10.1007 / BF02101694 . PMID 3934395 . S2CID 25554168 .  
  14. ^ Kishino H, Hasegawa M (agosto de 1989). "Evaluación de la estimación de máxima verosimilitud de las topologías del árbol evolutivo a partir de datos de secuencia de ADN y el orden de ramificación en hominoidea". Revista de evolución molecular . 29 (2): 170–9. Código Bibliográfico : 1989JMolE..29..170K . doi : 10.1007 / BF02100115 . PMID 2509717 . S2CID 8045061 .  
  15. ^ Felsenstein J, Churchill GA (enero de 1996). "Un enfoque del modelo de Markov oculto para la variación entre sitios en la tasa de evolución" . Biología Molecular y Evolución . 13 (1): 93-104. doi : 10.1093 / oxfordjournals.molbev.a025575 . PMID 8583911 . 
  16. ↑ a b Tamura K (julio de 1992). "Estimación del número de sustituciones de nucleótidos cuando hay fuertes sesgos de transición-transversión y contenido de G + C" . Biología Molecular y Evolución . 9 (4): 678–87. doi : 10.1093 / oxfordjournals.molbev.a040752 . PMID 1630306 . 
  17. ^ Tamura K, Nei M (mayo de 1993). "Estimación del número de sustituciones de nucleótidos en la región de control del ADN mitocondrial en humanos y chimpancés" . Biología Molecular y Evolución . 10 (3): 512–26. doi : 10.1093 / oxfordjournals.molbev.a040023 . PMID 8336541 . 
  18. ↑ a b Tavaré S (1986). "Algunos problemas probabilísticos y estadísticos en el análisis de secuencias de ADN" (PDF) . Conferencias sobre Matemáticas en las Ciencias de la Vida . 17 : 57–86.

Lectura adicional

  • Gu X, Li WH (septiembre de 1992). "Tasas más altas de sustitución de aminoácidos en roedores que en humanos". Filogenética molecular y evolución . 1 (3): 211–4. doi : 10.1016 / 1055-7903 (92) 90017-B . PMID  1342937 .
  • Li WH, Ellsworth DL, Krushkal J, Chang BH, Hewett-Emmett D (febrero de 1996). "Tasas de sustitución de nucleótidos en primates y roedores y la hipótesis del efecto del tiempo de generación". Filogenética molecular y evolución . 5 (1): 182–7. doi : 10.1006 / mpev.1996.0012 . PMID  8673286 .

Enlaces externos

  • DAWG: DNA Assembly With Gaps : software gratuito para simular la evolución de la secuencia