Modelo de tiempo de primer golpe

Los eventos a menudo se desencadenan cuando un proceso estocástico o aleatorio encuentra por primera vez un umbral. El umbral puede ser una barrera, un límite o un estado específico de un sistema. La cantidad de tiempo necesario para que un proceso estocástico , a partir de algún estado inicial, alcance un umbral por primera vez se denomina de forma diversa como tiempo de primer golpe . En estadística , los modelos de tiempo de primer golpe son una subclase de modelos de supervivencia . El primer tiempo de golpe, también llamado tiempo de primer paso , del conjunto de barreras. ${\ Displaystyle B}$ con respecto a una instancia de un proceso estocástico es el tiempo hasta que el proceso estocástico entra por primera vez ${\ Displaystyle B}$ .

De manera más coloquial, un tiempo de primer paso en un sistema estocástico es el tiempo que tarda una variable de estado en alcanzar un cierto valor. Comprender esta métrica permite comprender mejor el sistema físico bajo observación y, como tal, ha sido tema de investigación en campos muy diversos, desde la economía hasta la ecología . ^[1]

La idea de que un primer tiempo de impacto de un proceso estocástico podría describir el tiempo hasta la ocurrencia de un evento tiene una larga historia, comenzando con un interés en el primer paso del tiempo de los procesos de difusión de Wiener en economía y luego en física a principios del siglo XX. ^[2]^[3]^[4] Modelar la probabilidad de ruina financiera como un primer paso del tiempo fue una aplicación temprana en el campo de los seguros. ^[5] Un interés en las propiedades matemáticas de los primeros tiempos y los modelos y métodos estadísticos para el análisis de los datos de supervivencia apareció de manera constante entre mediados y finales del siglo XX. ^[6]^[7]^[8]^[9]^[10]

Ejemplos de

Un ejemplo común de un modelo de tiempo de primer golpe es un problema de ruina , como la ruina de jugador . En este ejemplo, una entidad (a menudo descrita como un jugador o una compañía de seguros) tiene una cantidad de dinero que varía aleatoriamente con el tiempo, posiblemente con cierta desviación . El modelo considera el caso de que la cantidad de dinero llegue a 0, lo que representa la quiebra. El modelo puede responder preguntas como la probabilidad de que esto ocurra dentro de un tiempo finito o el tiempo medio hasta el cual ocurre.

Los modelos de tiempo de primera respuesta se pueden aplicar a vidas esperadas, de pacientes o dispositivos mecánicos. Cuando el proceso alcanza un estado de umbral adverso por primera vez, el paciente muere o el dispositivo se avería.

Primer tiempo de paso de una partícula browniana 1D

Uno de los sistemas estocásticos más simples y omnipresentes es el de la partícula browniana en una dimensión. Este sistema describe el movimiento de una partícula que se mueve estocásticamente en un espacio unidimensional, con la misma probabilidad de moverse hacia la izquierda o hacia la derecha. Dado que el movimiento browniano se utiliza a menudo como una herramienta para comprender fenómenos más complejos, es importante comprender la probabilidad de que un primer paso de la partícula browniana alcance una posición distante de su ubicación inicial. Esto se hace a través de los siguientes medios.

La función de densidad de probabilidad (PDF) para una partícula en una dimensión se encuentra resolviendo la ecuación de difusión unidimensional . (Esta ecuación establece que la densidad de probabilidad de posición se difunde hacia afuera con el tiempo. Es análogo a decir crema en una taza de café si inicialmente la crema estaba contenida en un lugar pequeño. Después de mucho tiempo, la crema se ha difundido por toda la bebida. uniformemente.) A saber,

{\ displaystyle {\ frac {\ parcial p (x, t \ mid x_ {0})} {\ parcial t}} = D {\ frac {\ parcial ^ {2} p (x, t \ mid x_ {0 })} {\ partial x ^ {2}}},}

dada la condición inicial ${\ Displaystyle p (x, t = {0} \ mid x_ {0}) = \ delta (x-x_ {0})}$ ; dónde ${\ Displaystyle x (t)}$ es la posición de la partícula en un momento dado, ${\ Displaystyle x_ {0}}$ es la posición inicial de la partícula etiquetada, y ${\ Displaystyle D}$ es la constante de difusión con las unidades SI ${\ Displaystyle m ^ {2} s ^ {- 1}}$ (una medida indirecta de la velocidad de la partícula). La barra en el argumento de la probabilidad instantánea se refiere a la probabilidad condicional. La ecuación de difusión establece que la tasa de cambio a lo largo del tiempo en la probabilidad de encontrar la partícula en ${\ Displaystyle x (t)}$ La posición depende de la desaceleración sobre la distancia de dicha probabilidad en esa posición.

Se puede demostrar que el PDF unidimensional es

{\ Displaystyle p (x, t; x_ {0}) = {\ frac {1} {\ sqrt {4 \ pi Dt}}} \ exp \ left (- {\ frac {(x-x_ {0}) ^ {2}} {4Dt}} \ derecha).}

Esto establece que la probabilidad de encontrar la partícula en ${\ Displaystyle x (t)}$ es gaussiano, y el ancho del gaussiano depende del tiempo. Más específicamente, el ancho completo a la mitad del máximo (FWHM); técnicamente, esta es en realidad la duración completa a la mitad del máximo, ya que la variable independiente es el tiempo, escalas como

{\ Displaystyle {\ rm {FWHM}} \ sim {\ sqrt {t}}.}

Usando el PDF, uno puede derivar el promedio de una función dada, ${\ Displaystyle L}$ , en el momento ${\ Displaystyle t}$ :

{\ Displaystyle \ langle L (t) \ rangle \ equiv \ int _ {- \ infty} ^ {\ infty} L (x, t) p (x, t) \, dx,}

donde el promedio se toma sobre todo el espacio (o cualquier variable aplicable).

La densidad de tiempo del primer paso (FPTD) es la probabilidad de que una partícula haya alcanzado primero un punto ${\ Displaystyle x_ {c}}$ en el momento exacto ${\ Displaystyle t}$ (no en algún momento durante el intervalo hasta ${\ Displaystyle t}$ ). Esta densidad de probabilidad se puede calcular a partir de la probabilidad de supervivencia (una medida de probabilidad más común en las estadísticas). Considere la condición de frontera absorbente ${\ Displaystyle p (x_ {c}, t) = 0}$ (El subíndice c para el punto de absorción ${\ Displaystyle x_ {c}}$ es una abreviatura de acantilado que se utiliza en muchos textos como analogía de un punto de absorción). El PDF que satisface esta condición de contorno viene dado por

{\ Displaystyle p (x, t; x_ {0}, x_ {c}) = {\ frac {1} {\ sqrt {4 \ pi Dt}}} \ left (\ exp \ left (- {\ frac { (x-x_ {0}) ^ {2}} {4Dt}} \ right) - \ exp \ left (- {\ frac {(x- (2x_ {c} -x_ {0})) ^ {2} } {4Dt}} \ derecha) \ derecha),}

por ${\ Displaystyle x$ . La probabilidad de supervivencia, la probabilidad de que la partícula haya permanecido en una posición ${\ Displaystyle x$ para todo el tiempo hasta ${\ Displaystyle t}$ , es dado por

{\ Displaystyle S (t) \ equiv \ int _ {- \ infty} ^ {x_ {c}} p (x, t; x_ {0}, x_ {c}) \, dx = \ operatorname {erf} \ izquierda ({\ frac {x_ {c} -x_ {0}} {2 {\ sqrt {Dt}}}} \ right),}

dónde ${\ Displaystyle \ operatorname {erf}}$ es la función de error . La relación entre la probabilidad de supervivencia y el FPTD es la siguiente: la probabilidad de que una partícula haya alcanzado el punto de absorción entre tiempos ${\ Displaystyle t}$ y ${\ Displaystyle t + dt}$ es ${\ Displaystyle f (t) \, dt = S (t) -S (t + dt)}$ . Si se usa la aproximación de Taylor de primer orden, la definición del FPTD sigue):

{\ Displaystyle f (t) = - {\ frac {\ parcial S (t)} {\ parcial t}}.}

Utilizando la ecuación de difusión e integrando, el FPTD explícito es

{\ Displaystyle f (t) \ equiv {\ frac {| x_ {c} -x_ {0} |} {\ sqrt {4 \ pi Dt ^ {3}}}} \ exp \ left (- {\ frac { (x_ {c} -x_ {0}) ^ {2}} {4Dt}} \ derecha).}

Por tanto, el tiempo de primer paso de una partícula browniana sigue una distribución de Lévy .

Para ${\ Displaystyle t \ gg {\ frac {(x_ {c} -x_ {0}) ^ {2}} {4D}}}$ , se sigue de arriba que

{\ Displaystyle f (t) = {\ frac {\ Delta x} {\ sqrt {4 \ pi Dt ^ {3}}}} \ sim t ^ {- 3/2},}

dónde ${\ Displaystyle \ Delta x \ equiv | x_ {c} -x_ {0} |}$ . Esta ecuación establece que la probabilidad de que una partícula browniana logre un primer paso en un tiempo prolongado (definido en el párrafo anterior) se vuelve cada vez más pequeña, pero siempre finita .

El primer momento del FPTD diverge (ya que es una distribución denominada de cola pesada ), por lo tanto, no se puede calcular el FPT promedio, por lo que, en cambio, se puede calcular el tiempo típico , el tiempo en el que el FPTD está en un máximo ( ${\ Displaystyle \ parcial f / \ parcial t = 0}$ ), es decir,

{\ Displaystyle \ tau _ {\ rm {ty}} = {\ frac {\ Delta x ^ {2}} {6D}}.}

Aplicaciones del primer momento en muchas familias de procesos estocásticos

Los primeros tiempos de impacto son características centrales de muchas familias de procesos estocásticos, incluidos los procesos de Poisson , los procesos de Wiener , los procesos gamma y las cadenas de Markov , por nombrar solo algunos. El estado del proceso estocástico puede representar, por ejemplo, la fortaleza de un sistema físico, la salud de un individuo o la condición financiera de una empresa comercial. El sistema, individuo o empresa, falla o experimenta algún otro punto final crítico cuando el proceso alcanza un estado de umbral por primera vez. El evento crítico puede ser un evento adverso (como falla del equipo, insuficiencia cardíaca congestionada o cáncer de pulmón) o un evento positivo (como recuperación de una enfermedad, alta hospitalaria, parto o regreso al trabajo después de una lesión traumática). El lapso de tiempo hasta que ocurre ese evento crítico generalmente se interpreta genéricamente como un 'tiempo de supervivencia'. En algunas aplicaciones, el umbral es un conjunto de estados múltiples, por lo que se tienen en cuenta los tiempos competitivos de los primeros golpes para alcanzar el primer umbral del conjunto, como es el caso cuando se consideran las causas competitivas de falla en el equipo o muerte de un paciente.

Regresión de umbral: regresión del tiempo del primer golpe

Las aplicaciones prácticas de modelos teóricos para los primeros tiempos de acierto a menudo involucran estructuras de regresión . Cuando los primeros modelos de tiempo de acierto están equipados con estructuras de regresión, acomodando datos de covariables, lo llamamos regresión de umbral de estructura de regresión . ^[11] El estado de umbral, los parámetros del proceso e incluso la escala de tiempo pueden depender de las covariables correspondientes. La regresión de umbral aplicada a los datos de tiempo transcurrido hasta el evento ha surgido desde principios de este siglo y ha crecido rápidamente, como se describe en un artículo de una encuesta de 2006 ^[12] y sus referencias. Se investigaron las conexiones entre los modelos de regresión de umbral derivados de los primeros tiempos de acierto y el omnipresente modelo de regresión de riesgos proporcionales de Cox ^[13] . ^[14] Aplicaciones del rango de regresión de umbral en muchos campos, incluidas las ciencias físicas y naturales, la ingeniería, las ciencias sociales y la economía. y negocios, agricultura, salud y medicina. ^[15]^[16]^[17]^[18]^[19]

Latente vs observable

En muchas aplicaciones del mundo real, un modelo de tiempo de primera llegada (FHT) tiene tres componentes subyacentes: (1) un proceso estocástico principal ${\ Displaystyle \ {X (t) \} \, \,}$ , que puede estar latente, (2) un umbral (o la barrera) y (3) una escala de tiempo . El primer momento de golpe se define como el momento en que el proceso estocástico alcanza por primera vez el umbral. Es muy importante distinguir si la ruta muestral del proceso padre es latente (es decir, inobservable) u observable, y tal distinción es una característica del modelo FHT. Con mucho, los procesos latentes son los más comunes. Para dar un ejemplo, podemos usar un proceso de Wiener ${\ Displaystyle \ {X (t), t \ geq 0 \, \} \,}$ como proceso estocástico padre. Dicho proceso de Wiener se puede definir con el parámetro medio ${\ Displaystyle {\ mu} \, \,}$ , el parámetro de varianza ${\ Displaystyle {\ sigma ^ {2}} \, \,}$ , y el valor inicial ${\ Displaystyle X (0) = x_ {0}> 0 \,}$ .

Escala de tiempo operacional o analítica

La escala de tiempo del proceso estocástico puede ser la hora del calendario o del reloj o alguna medida más operativa de la progresión del tiempo, como el kilometraje de un automóvil, el desgaste acumulado en un componente de la máquina o la exposición acumulada a humos tóxicos. En muchas aplicaciones, el proceso estocástico que describe el estado del sistema es latente o inobservable y sus propiedades deben inferirse indirectamente a partir de datos censurados de tiempo transcurrido hasta el evento y / o lecturas tomadas a lo largo del tiempo en procesos correlacionados, como los procesos de marcadores. La palabra "regresión" en la regresión de umbral se refiere a los modelos de tiempo de primer acierto en los que se insertan una o más estructuras de regresión en el modelo para conectar los parámetros del modelo a las variables explicativas o covariables. Los parámetros dados estructuras de regresión pueden ser parámetros del proceso estocástico, el estado de umbral y / o la propia escala de tiempo.

Ver también

Referencias

^ Redner 2001
↑ Bachelier 1900
^ Von E 1900
^ Smoluchowski 1915
^ Lundberg 1903
↑ Tweedie, 1945
^ Tweedie 1957–1
^ Tweedie 1957-2
^ Whitmore 1970
^ Lancaster 1972
^ Lee 2006
^ Lee 2006
^ Cox 1972
^ Lee 2010
^ Aarón 2010
^ Chambaz 2014
↑ Aaron 2015
^ Él 2015
^ Hou 2016

Whitmore, GA (1986). "Modelos de tiempo de primer paso para estructuras de regresión de datos de duración y riesgos competitivos". El estadístico . 35 : 207–219. doi : 10.2307 / 2987525 . JSTOR 2987525 .
Whitmore, GA (1995). "Estimación de la degradación por un proceso de difusión de Wiener sujeto a error de medición". Análisis de datos de por vida . 1 (3): 307–319. doi : 10.1007 / BF00985762 .
Whitmore, GA; Crowder, MJ; Lawless, JF (1998). "Inferencia de fallas a partir de un proceso de marcador basado en un modelo de Wiener bivariado". Análisis de datos de por vida . 4 (3): 229-251. doi : 10.1023 / A: 1009617814586 .
Redner, S. (2001). Una guía para los procesos de primer paso . Prensa de la Universidad de Cambridge. ISBN 0-521-65248-0.
Lee, M.-LT; Whitmore, GA (2006). "Regresión de umbral para el análisis de supervivencia: modelado de tiempos de eventos mediante un proceso estocástico". Ciencia estadística . 21 (4): 501–513. arXiv : 0708.0346 . doi : 10.1214 / 088342306000000330 .
Licenciado, L. (1900). "Théorie de la Spéculation". Annales Scientifiques de l'École Normale Supérieure . 3 (17): 21–86.
Schrodinger, E. (1915). "Zur Theorie der Fall-und Steigversuche an Teilchen mit Brownscher Bewegung". Physikalische Zeitschrift . 16 : 289–295.
Smoluchowski, MV (1915). "Notiz über die Berechning der Brownschen Molkularbewegung bei des Ehrenhaft-millikanchen Versuchsanordnung". Physikalische Zeitschrift . 16 : 318–321.
Lundberg, F. (1903). Aproximadamente Framställning av Sannolikehetsfunktionen, Återförsäkering av Kollektivrisker . Almqvist y Wiksell, Uppsala.
Tweedie, MCK (1945). "Variables estadísticas inversas" . Naturaleza . 155 : 453. Bibcode : 1945Natur.155..453T . doi : 10.1038 / 155453a0 .
Tweedie, MCK (1957). "Propiedades estadísticas de distribuciones gaussianas inversas - I" . Anales de estadística matemática . 28 : 362–377. doi : 10.1214 / aoms / 1177706964 .
Tweedie, MCK (1957). "Propiedades estadísticas de distribuciones gaussianas inversas - II". Anales de estadística matemática . 28 : 696–705. doi : 10.1214 / aoms / 1177706881 .
Whitmore, GA; Neufeldt, AH (1970). "Una aplicación de modelos estadísticos en la investigación en salud mental". Toro. Matemáticas. Biophys . 32 : 563–579.
Lancaster, T. (1972). "Un modelo estocástico para la duración de una huelga". J. Roy. Estadístico. Soc. Ser. Una . 135 : 257-271.
Cox, RD (1972). "Modelos de regresión y tablas de vida (con discusión)". JR Stat Soc Ser B . 187 : 187–230.
Lee, M.-LT; Whitmore, GA (2010). "Riesgos proporcionales umbral y regresión umbral: sus conexiones teóricas y prácticas" . Análisis de datos de por vida . 16 : 196-214. doi : 10.1007 / s10985-009-9138-0 . PMC 6447409 . PMID 19960249 .
Aaron, SD; Ramsay, T .; Vandemheen, K .; Whitmore, GA (2010). "Un modelo de regresión de umbral para las exacerbaciones recurrentes en la enfermedad pulmonar obstructiva crónica". Revista de epidemiología clínica . 63 : 1324-1331. doi : 10.1016 / j.jclinepi.2010.05.007 .
Chambaz, A .; Choudat, D .; Huber, C .; Pairon, J .; Van der Lann, MJ (2014). "Análisis de la exposición ocupacional al amianto basado en el modelado de regresión de umbral de datos de casos y controles" . Bioestadística . 15 : 327–340. doi : 10.1093 / bioestadística / kxt042 .
Aaron, SD; Stephenson, AL; Cameron, DW; Whitmore, GA (2015). "Un modelo estadístico para predecir el riesgo de muerte en un año en pacientes con fibrosis quística". Revista de epidemiología clínica . 68 : 1336-1345. doi : 10.1016 / j.jclinepi.2014.12.010 .
Él, X .; Whitmore, GA; Vaya, GY; Hochberg, MC; Lee, M.-LT (2015). "Un modelo de tiempo para fracturar con una corriente de choque superpuesta a la degradación progresiva: el estudio de las fracturas osteoporóticas" . Estadística en Medicina . 34 : 652–663. doi : 10.1002 / sim.6356 . PMC 4314426 . PMID 25376757 .
Hou, W.-H .; Chuang, H.-Y .; Lee, M.-LT (2016). "Un modelo de regresión de umbral para predecir el regreso al trabajo después de una lesión traumática en una extremidad". Lesión . 47 : 483–489. doi : 10.1016 / j.injury.2015.11.032 .

[1] Redner 2001

[2] Bachelier 1900

[3] Von E 1900

[4] Smoluchowski 1915

[5] Lundberg 1903

[6] Tweedie, 1945

[7] Tweedie 1957–1

[8] Tweedie 1957-2

[9] Whitmore 1970

[10] Lancaster 1972

[11] Lee 2006

[12] Lee 2006

[13] Cox 1972

[14] Lee 2010

[15] Aarón 2010

[16] Chambaz 2014

[17] Aaron 2015

[18] Él 2015

[19] Hou 2016

[1]