En la teoría de la probabilidad , un proceso de ramificación es un tipo de objeto matemático conocido como proceso estocástico , que consiste en colecciones de variables aleatorias . Las variables aleatorias de un proceso estocástico están indexadas por números naturales. El propósito original de los procesos de ramificación era servir como modelo matemático de una población en la que cada individuo de la generación produce un número aleatorio de individuos en la generación , según, en el caso más simple, una distribución de probabilidad fija que no varía de un individuo a otro. [1] Los procesos de ramificación se utilizan para modelar la reproducción; por ejemplo, los individuos pueden corresponder a bacterias, cada una de las cuales genera 0, 1 o 2 descendientes con alguna probabilidad en una sola unidad de tiempo. Los procesos de ramificación también se pueden utilizar para modelar otros sistemas con dinámicas similares, por ejemplo, la propagación de apellidos en la genealogía o la propagación de neutrones en un reactor nuclear .
Una cuestión central en la teoría de los procesos de ramificación es la probabilidad de extinción final , donde no existen individuos después de un número finito de generaciones. Usando la ecuación de Wald , se puede demostrar que comenzando con un individuo en la generación cero, el tamaño esperado de la generación n es igual a μ n donde μ es el número esperado de hijos de cada individuo. Si μ <1, entonces el número esperado de individuos pasa rápidamente a cero, lo que implica la extinción final con probabilidad 1 por la desigualdad de Markov . Alternativamente, si μ> 1, entonces la probabilidad de extinción final es menor que 1 (pero no necesariamente cero; considere un proceso donde cada individuo tiene 0 o 100 hijos con la misma probabilidad. En ese caso, μ = 50, pero probabilidad de la extinción final es mayor que 0.5, ya que esa es la probabilidad de que el primer individuo tenga 0 hijos). Si μ = 1, entonces la extinción final ocurre con probabilidad 1, a menos que cada individuo siempre tenga exactamente un hijo.
En ecología teórica , el parámetro μ de un proceso de ramificación se llama tasa reproductiva básica .
Formulación matemática
La formulación más común de un proceso de ramificación es la del proceso de Galton-Watson . Sea Z n el estado en el período n (a menudo interpretado como el tamaño de la generación n ), y sea X n, i una variable aleatoria que denota el número de sucesores directos del miembro i en el período n , donde X n, i son independientes y variables aleatorias distribuidas de forma idéntica sobre todos n ∈ {0, 1, 2, ...} yi ∈ {1, ..., Z n }. Entonces la ecuación de recurrencia es
con Z 0 = 1.
Alternativamente, el proceso de ramificación se puede formular como un recorrido aleatorio . Sea S i el estado en el período i , y sea X i una variable aleatoria que es iid sobre todo i . Entonces la ecuación de recurrencia es
con S 0 = 1. Para ganar algo de intuición para esta formulación, imagine una caminata donde el objetivo es visitar cada nodo, pero cada vez que se visita un nodo no visitado previamente, se revelan nodos adicionales que también deben visitarse. Sea S i el número de nodos revelados pero no visitados en el período i , y sea X i el número de nuevos nodos que se revelen cuando se visita el nodo i . Luego, en cada período, el número de nodos revelados pero no visitados es igual al número de dichos nodos en el período anterior, más los nuevos nodos que se revelan al visitar un nodo, menos el nodo que se visita. El proceso finaliza una vez que se han visitado todos los nodos revelados.
Procesos de ramificación en tiempo continuo
Para los procesos de ramificación de tiempo discreto, el "tiempo de ramificación" se fija en 1 para todos los individuos. Para los procesos de ramificación de tiempo continuo, cada individuo espera un tiempo aleatorio (que es una variable aleatoria continua) y luego se divide de acuerdo con la distribución dada. El tiempo de espera para los diferentes individuos es independiente y es independiente del número de niños. En general, el tiempo de espera es una variable exponencial con parámetro λ para todos los individuos, por lo que el proceso es de Markov.
Problema de extinción para un proceso de Galton Watson
La probabilidad de extinción última está dada por
Para cualquier caso no trivial (los casos triviales son aquellos en los que la probabilidad de no tener descendencia es cero para cada miembro de la población; en tales casos, la probabilidad de extinción final es 0), la probabilidad de extinción final es igual a uno si μ ≤ 1 y estrictamente menos de uno si μ > 1.
El proceso se puede analizar utilizando el método de función generadora de probabilidad . Sean p 0 , p 1 , p 2 , ... las probabilidades de producir 0, 1, 2, ... descendencia por cada individuo en cada generación. Sea d m la probabilidad de extinción por la m ésima generación. Obviamente, d 0 = 0. Como las probabilidades para todas las rutas que conducen a 0 por el m º generación debe ser añadido hasta, la probabilidad de extinción es no decreciente en generaciones. Es decir,
Por lo tanto, d m converge a un límite d, y d es la probabilidad de extinción última. Si hay j descendientes en la primera generación, entonces, para morir en la m-ésima generación, cada una de estas líneas debe morir en m-1 generaciones. Dado que proceden de forma independiente, la probabilidad es ( d m − 1 ) j . Por lo tanto,
El lado derecho de la ecuación es una función generadora de probabilidad. Sea h ( z ) la función generadora ordinaria para p i :
Usando la función generadora, la ecuación anterior se convierte en
Como d m → d , d se puede encontrar resolviendo
Esto también es equivalente a encontrar el punto o los puntos de intersección de las líneas y = z y y = h ( z ) para z ≥ 0. y = z es una línea recta. y = h ( z ) es un aumento (ya que) y convexo (desde ) función. Hay como máximo dos puntos de intersección. Dado que (1,1) es siempre un punto de intersección para las dos funciones, solo existen tres casos:
El caso 1 tiene otro punto de intersección en z <1 (vea la curva roja en el gráfico).
El caso 2 tiene solo un punto de intersección en z = 1. (Vea la curva verde en el gráfico)
El caso 3 tiene otro punto de intersección en z > 1. (Vea la curva negra en el gráfico)
En el caso 1, la probabilidad de extinción final es estrictamente menor que uno. Para los casos 2 y 3, la probabilidad de extinción final es igual a uno.
Al observar que h ′ (1) = p 1 + 2 p 2 + 3 p 3 + ... = μ es exactamente el número esperado de descendientes que un padre podría producir, se puede concluir que para un proceso de ramificación con función generadora h ( z ) para el número de descendientes de un padre dado, si el número medio de descendientes producidos por un solo padre es menor o igual a uno, entonces la probabilidad de extinción final es uno. Si el número medio de descendientes producidos por un solo padre es mayor que uno, entonces la probabilidad de extinción final es estrictamente menor que uno.
Procesos de ramificación dependientes del tamaño
Junto con la discusión de un modelo más general de procesos de ramificación conocido como procesos de ramificación dependientes de la edad por Grimmett, [2] en el que los individuos viven durante más de una generación, Krishna Athreya ha identificado tres distinciones entre los procesos de ramificación dependientes del tamaño que tienen aplicación general . Athreya identifica las tres clases de procesos de ramificación dependientes del tamaño como medidas de ramificación subcríticas, estables y supercríticas. Para Athreya, los parámetros centrales son cruciales para controlar si se quiere evitar la ramificación inestable subcrítica y supercrítica. [3] Los procesos de ramificación dependientes del tamaño también se tratan en el tema del proceso de ramificación dependiente de los recursos [4]
Ejemplo de problema de extinción
Considere que un padre puede producir como máximo dos crías. La probabilidad de extinción en cada generación es:
con d 0 = 0. Para la probabilidad de extinción final, necesitamos encontrar d que satisfaga d = p 0 + p 1 d + p 2 d 2 .
Tomando como ejemplo las probabilidades para el número de descendientes producidos p 0 = 0.1, p 1 = 0.6 yp 2 = 0.3, la probabilidad de extinción para las primeras 20 generaciones es la siguiente:
Generación # (1–10) | Probabilidad de extinción | Generación # (11-20) | Probabilidad de extinción | |
---|---|---|---|---|
1 | 0,1 | 11 | 0.3156 | |
2 | 0,163 | 12 | 0.3192 | |
3 | 0,2058 | 13 | 0.3221 | |
4 | 0.2362 | 14 | 0.3244 | |
5 | 0,2584 | 15 | 0.3262 | |
6 | 0.2751 | dieciséis | 0.3276 | |
7 | 0.2878 | 17 | 0.3288 | |
8 | 0.2975 | 18 | 0.3297 | |
9 | 0.3051 | 19 | 0.3304 | |
10 | 0.3109 | 20 | 0.331 |
En este ejemplo, podemos resolver algebraicamente que d = 1/3, y este es el valor al que converge la probabilidad de extinción con las generaciones crecientes.
Simular procesos de ramificación
Los procesos de ramificación se pueden simular para una variedad de problemas. Un uso específico del proceso de ramificación simulado se encuentra en el campo de la biología evolutiva. [5] [6] Los árboles filogenéticos, por ejemplo, se pueden simular bajo varios modelos, [7] ayudando a desarrollar y validar métodos de estimación, así como a respaldar la prueba de hipótesis.
Procesos de ramificación multitipo
En los procesos de ramificación de múltiples tipos, los individuos no son idénticos, pero pueden clasificarse en n tipos. Después de cada paso de tiempo, un individuo de tipo i producirá individuos de diferentes tipos, y, un vector aleatorio que representa el número de niños en diferentes tipos, satisface una distribución de probabilidad en .
Por ejemplo, considere la población de células madre cancerosas (CSC) y células cancerosas no madre (NSCC). Después de cada intervalo de tiempo, cada CSC tiene probabilidad para producir dos CSC (división simétrica), probabilidad para producir un CSC y un NSCC (división asimétrica), probabilidad para producir un CSC (estancamiento), y probabilidad no producir nada (muerte); cada NSCC tiene probabilidad para producir dos NSCC (división simétrica), probabilidad para producir un NSCC (estancamiento), y probabilidad no producir nada (muerte). [8]
Ley de los grandes números para procesos de ramificación multitipo
Para los procesos de ramificación de múltiples tipos en los que las poblaciones de diferentes tipos crecen exponencialmente, las proporciones de diferentes tipos convergen casi con seguridad en un vector constante en algunas condiciones suaves. Ésta es la fuerte ley de los grandes números para los procesos de ramificación de varios tipos.
Para los casos de tiempo continuo, las proporciones de la expectativa de la población satisfacen un sistema de EDO , que tiene un punto fijo de atracción único. Este punto fijo es solo el vector al que convergen las proporciones en la ley de los grandes números.
La monografía de Athreya y Ney [9] resume un conjunto común de condiciones bajo las cuales esta ley de los grandes números es válida. Posteriormente se realizan algunas mejoras descartando diferentes condiciones. [10] [11]
Otros procesos de ramificación
Hay muchos otros procesos de ramificación, por ejemplo, procesos de ramificación en entornos aleatorios, en los que la ley de reproducción se elige al azar en cada generación.
Ver también
Referencias
- ^ Athreya, KB (2006). "Proceso de ramificación". Enciclopedia de Medioambiente . doi : 10.1002 / 9780470057339.vab032 . ISBN 978-0471899976.
- ^ GR Grimmett y DR Stirzaker, Probabilidad y procesos aleatorios, 2a ed., Clarendon Press, Oxford, 1992.
- ^ Krishna Athreya y Peter Jagers. Procesos de ramificación . Saltador. 1973.
- ^ F. Thomas Bruss y M. Duerinckx (2015) "Procesos de ramificación dependientes de recursos y la envoltura de las sociedades", Anales de probabilidad aplicada. 25: 324–372.
- ^ Hagen, O .; Hartmann, K .; Acero, M .; Stadler, T. (1 de mayo de 2015). "La especiación dependiente de la edad puede explicar la forma de las filogenias empíricas" . Biología sistemática . 64 (3): 432–440. doi : 10.1093 / sysbio / syv001 . ISSN 1063-5157 . PMC 4395845 . PMID 25575504 .
- ^ Hagen, Oskar; Andermann, Tobias; Quental, Tiago B .; Antonelli, Alexandre; Silvestro, Daniele (mayo de 2018). "Estimación de la extinción dependiente de la edad: evidencia contrastante de fósiles y filogenias" . Biología sistemática . 67 (3): 458–474. doi : 10.1093 / sysbio / syx082 . PMC 5920349 . PMID 29069434 .
- ^ Hagen, Oskar; Stadler, Tanja (2018). "TreeSimGM: simulación de árboles filogenéticos en modelos generales de Bellman-Harris con cambios específicos de linaje de especiación y extinción en R" . Métodos en ecología y evolución . 9 (3): 754–760. doi : 10.1111 / 2041-210X.12917 . ISSN 2041-210X . PMC 5993341 . PMID 29938014 .
- ^ Chen, Xiufang; Wang, Yue; Feng, Tianquan; Yi, Ming; Zhang, Xingan; Zhou, Da (2016). "El sobreimpulso y el equilibrio fenotípico en la caracterización de la dinámica del cáncer de plasticidad fenotípica reversible" . Revista de Biología Teórica . 390 : 40–49. arXiv : 1503.04558 . doi : 10.1016 / j.jtbi.2015.11.008 . PMID 26626088 . S2CID 15335040 .
- ^ Athreya, Krishna B .; Ney, Peter E. (1972). Procesos de ramificación . Berlín: Springer-Verlag. págs. 199–206. ISBN 978-3-642-65371-1.
- ^ Janson, Svante (2003). "Teoremas del límite funcional para procesos de ramificación multitipo y urnas Pólya generalizadas". Procesos estocásticos y sus aplicaciones . 110 (2): 177–245. doi : 10.1016 / j.spa.2003.12.002 .
- ^ Jiang, Da-Quan; Wang, Yue; Zhou, Da (2017). "Equilibrio fenotípico como convergencia probabilística en la dinámica de la población celular de múltiples fenotipos" . PLOS ONE . 12 (2): e0170916. Código bibliográfico : 2017PLoSO..1270916J . doi : 10.1371 / journal.pone.0170916 . PMC 5300154 . PMID 28182672 .
- CM Grinstead y JL Snell, Introducción a la probabilidad , 2ª ed. La sección 10.3 discute los procesos de ramificación en detalle junto con la aplicación de funciones generadoras para estudiarlos.
- GR Grimmett y DR Stirzaker, Probability and Random Processes , 2ª ed., Clarendon Press, Oxford, 1992. La sección 5.4 analiza el modelo de procesos de ramificación descrito anteriormente. La sección 5.5 analiza un modelo más general de procesos de ramificación conocidos como procesos de ramificación dependientes de la edad , en los que los individuos viven durante más de una generación.