De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda

La función de supervivencia es una función que da la probabilidad de que un paciente, dispositivo u otro objeto de interés sobreviva más allá de un tiempo especificado. [1]

La función de supervivencia también se conoce como función de supervivencia [2] o función de confiabilidad . [3]

El término función de confiabilidad es común en ingeniería, mientras que el término función de supervivencia se usa en una gama más amplia de aplicaciones, incluida la mortalidad humana. Otro nombre para la función de supervivencia es la función de distribución acumulativa complementaria .

Definición [ editar ]

Sea T una variable aleatoria continua con función de distribución acumulativa F ( t ) en el intervalo [0, ∞). Su función de supervivencia o función de confiabilidad es:

Ejemplos de funciones de supervivencia [ editar ]

Los gráficos siguientes muestran ejemplos de funciones de supervivencia hipotéticas. El eje x es el tiempo. El eje y es la proporción de sujetos que sobreviven. Los gráficos muestran la probabilidad de que un sujeto sobreviva más allá del tiempo t.

Cuatro funciones de supervivencia

Por ejemplo, para la función de supervivencia 1, la probabilidad de sobrevivir más de t = 2 meses es 0,37. Es decir, el 37% de los sujetos sobrevive más de 2 meses.

Función de supervivencia 1

Para la función de supervivencia 2, la probabilidad de sobrevivir más de t = 2 meses es 0,97. Es decir, el 97% de los sujetos sobreviven más de 2 meses.

Función de supervivencia 2

La mediana de supervivencia se puede determinar a partir de la función de supervivencia. Por ejemplo, para la función de supervivencia 2, el 50% de los sujetos sobreviven 3,72 meses. Por tanto, la mediana de supervivencia es de 3,72 meses.

Función de supervivencia supervivencia media

En algunos casos, la mediana de supervivencia no se puede determinar a partir del gráfico. Por ejemplo, para la función de supervivencia 4, más del 50% de los sujetos sobreviven más que el período de observación de 10 meses.

Supervivencia media mayor de 10 meses

La función de supervivencia es una de varias formas de describir y mostrar los datos de supervivencia. Otra forma útil de mostrar datos es un gráfico que muestra la distribución de los tiempos de supervivencia de los sujetos. Olkin, [4] página 426, da el siguiente ejemplo de datos de supervivencia. Se registró el número de horas entre fallos sucesivos de un sistema de aire acondicionado. El tiempo entre fallos sucesivos es 1, 3, 5, 7, 11, 11, 11, 12, 14, 14, 14, 16, 16, 20, 21, 23, 42, 47, 52, 62, 71, 71, 87, 90, 95, 120, 120, 225, 246 y 261 horas. El tiempo medio entre fallos es 59,6. Este valor medio se utilizará en breve para ajustar una curva teórica a los datos. La siguiente figura muestra la distribución del tiempo entre fallas. Las marcas azules debajo del gráfico son las horas reales entre fallas sucesivas.

Distribución de tiempos de falla de CA

La distribución de los tiempos de falla se superpone con una curva que representa una distribución exponencial. Para este ejemplo, la distribución exponencial se aproxima a la distribución de los tiempos de falla. La curva exponencial es una distribución teórica ajustada a los tiempos de falla reales. Esta curva exponencial particular está especificada por el parámetro lambda, λ = 1 / (tiempo medio entre fallas) = ​​1 / 59.6 = 0.0168. La distribución de los tiempos de falla se denomina función de densidad de probabilidad (pdf), si el tiempo puede tomar cualquier valor positivo. En ecuaciones, el pdf se especifica como f (t). Si el tiempo solo puede tomar valores discretos (como 1 día, 2 días, etc.), la distribución de los tiempos de falla se denomina función de masa de probabilidad(pmf). La mayoría de los métodos de análisis de supervivencia asumen que el tiempo puede tomar cualquier valor positivo y que f (t) es el pdf. Si el tiempo entre las fallas observadas del acondicionador de aire se aproxima usando la función exponencial, entonces la curva exponencial da la función de densidad de probabilidad, f (t), para los tiempos de falla del acondicionador de aire.

Otra forma útil de mostrar los datos de supervivencia es un gráfico que muestra las fallas acumuladas hasta cada momento. Estos datos pueden mostrarse como el número acumulativo o la proporción acumulada de fallas hasta cada vez. El siguiente gráfico muestra la probabilidad acumulada (o proporción) de fallas en cada momento para el sistema de aire acondicionado. La línea de escalones en negro muestra la proporción acumulada de fallas. Para cada paso hay una marca azul en la parte inferior del gráfico que indica un tiempo de falla observado. La línea roja suave representa la curva exponencial ajustada a los datos observados.

CDF para fallas de CA

Un gráfico de la probabilidad acumulada de fallas hasta cada momento se denomina función de distribución acumulativa o CDF. En el análisis de supervivencia, la función de distribución acumulada da la probabilidad de que el tiempo de supervivencia sea menor o igual a un tiempo específico, t.

Sea T el tiempo de supervivencia, que es cualquier número positivo. Un tiempo particular se designa con la letra t minúscula. La función de distribución acumulativa de T es la función

donde el lado derecho representa la probabilidad de que la variable aleatoria T sea ​​menor o igual que t . Si el tiempo puede tomar cualquier valor positivo, entonces la función de distribución acumulativa F (t) es la integral de la función de densidad de probabilidad f (t).

Para el ejemplo de aire acondicionado, el gráfico de la CDF a continuación ilustra que la probabilidad de que el tiempo hasta la falla sea menor o igual a 100 horas es 0.81, según se estima usando la curva exponencial ajustada a los datos.

AC Tiempo de falla LT 100 horas

Una alternativa a graficar la probabilidad de que el tiempo de falla sea menor o igual a 100 horas es graficar la probabilidad de que el tiempo de falla sea mayor a 100 horas. La probabilidad de que el tiempo de falla sea mayor a 100 horas debe ser 1 menos la probabilidad de que el tiempo de falla sea menor o igual a 100 horas, porque la probabilidad total debe sumar 1.

Esto da

P (tiempo de falla> 100 horas) = ​​1 - P (tiempo de falla <100 horas) = ​​1 - 0.81 = 0.19.

Esta relación se generaliza a todos los tiempos de falla:

P (T> t) = 1 - P (T <t) = 1 - función de distribución acumulativa.

Esta relación se muestra en los gráficos siguientes. El gráfico de la izquierda es la función de distribución acumulada, que es P (T <t). El gráfico de la derecha es P (T> t) = 1 - P (T <t). El gráfico de la derecha es la función de supervivencia, S (t). El hecho de que S (t) = 1 - CDF es la razón por la que otro nombre para la función de supervivencia es la función de distribución acumulativa complementaria.

La función de supervivencia es 1 - CDF

Funciones de supervivencia paramétricas [ editar ]

En algunos casos, como en el ejemplo del acondicionador de aire, la distribución de los tiempos de supervivencia puede aproximarse bien mediante una función como la distribución exponencial. Varias distribuciones se utilizan comúnmente en el análisis de supervivencia, incluidas la exponencial, Weibull, gamma, normal, logarítmica normal y logarítmica logística. [3] [5] Estas distribuciones se definen mediante parámetros. La distribución normal (gaussiana), por ejemplo, está definida por los dos parámetros media y desviación estándar. Las funciones de supervivencia que se definen mediante parámetros se denominan paramétricas.

En los cuatro gráficos de funciones de supervivencia que se muestran arriba, la forma de la función de supervivencia está definida por una distribución de probabilidad particular: la función de supervivencia 1 está definida por una distribución exponencial, 2 está definida por una distribución de Weibull, 3 está definida por una distribución log-logística , y 4 está definido por otra distribución de Weibull.

Función de supervivencia exponencial [ editar ]

Para una distribución de supervivencia exponencial, la probabilidad de falla es la misma en todos los intervalos de tiempo, sin importar la edad del individuo o dispositivo. Este hecho conduce a la propiedad "sin memoria" de la distribución de supervivencia exponencial: la edad de un sujeto no tiene ningún efecto sobre la probabilidad de fracaso en el siguiente intervalo de tiempo. La exponencial puede ser un buen modelo para la vida útil de un sistema en el que las piezas se reemplazan cuando fallan. [6] También puede ser útil para modelar la supervivencia de organismos vivos en intervalos cortos. No es probable que sea un buen modelo de la vida útil completa de un organismo vivo. [7] Como señalan Efron y Hastie [8] (p. 134), "Si las vidas humanas fueran exponenciales, no habría ancianos ni jóvenes, solo afortunados o desafortunados".

Función de supervivencia de Weibull [ editar ]

Un supuesto clave de la función de supervivencia exponencial es que la tasa de riesgo es constante. En un ejemplo dado anteriormente, la proporción de hombres que mueren cada año fue constante en el 10%, lo que significa que la tasa de riesgo fue constante. La suposición de peligro constante puede no ser apropiada. Por ejemplo, entre la mayoría de los organismos vivos, el riesgo de muerte es mayor en la vejez que en la mediana edad, es decir, la tasa de peligro aumenta con el tiempo. Para algunas enfermedades, como el cáncer de mama, el riesgo de recurrencia es menor después de 5 años, es decir, la tasa de riesgo disminuye con el tiempo. La distribución de Weibull extiende la distribución exponencial para permitir tasas de riesgo constantes, crecientes o decrecientes.

Otras funciones de supervivencia paramétricas [ editar ]

Hay varias otras funciones de supervivencia paramétricas que pueden proporcionar un mejor ajuste a un conjunto de datos en particular, incluyendo normal, lognormal, log-logístico y gamma. La elección de la distribución paramétrica para una aplicación particular se puede realizar mediante métodos gráficos o pruebas formales de ajuste. Estas distribuciones y pruebas se describen en libros de texto sobre análisis de supervivencia. [1] [3] Lawless [9] tiene una amplia cobertura de modelos paramétricos.

Las funciones de supervivencia paramétricas se utilizan comúnmente en aplicaciones de fabricación, en parte porque permiten la estimación de la función de supervivencia más allá del período de observación. Sin embargo, el uso apropiado de funciones paramétricas requiere que los datos estén bien modelados por la distribución elegida. Si no se dispone de una distribución adecuada, o no se puede especificar antes de un ensayo clínico o experimento, las funciones de supervivencia no paramétricas ofrecen una alternativa útil.

Funciones de supervivencia no paramétricas [ editar ]

Un modelo paramétrico de supervivencia puede no ser posible o deseable. En estas situaciones, el método más común para modelar la función de supervivencia es el estimador no paramétrico de Kaplan-Meier .

Propiedades [ editar ]

  • Cada función de supervivencia está disminuyendo monótonamente , es decir, para todos .
    • Es una propiedad de una variable aleatoria que mapea un conjunto de eventos, generalmente asociados con la mortalidad o falla de algún sistema, en el tiempo .
  • El tiempo , representa algún origen, típicamente el inicio de un estudio o el inicio de operación de algún sistema. es comúnmente la unidad, pero puede ser menor para representar la probabilidad de que el sistema falle inmediatamente después de la operación.
  • Dado que la CDF es una función continua a la derecha , la función de supervivencia también es continua a la derecha.
  • La función de supervivencia se puede relacionar con la función de densidad de probabilidad y la función de riesgo.

Así que eso

  • El tiempo de supervivencia esperado

Ver también [ editar ]

  • Tasa de fracaso
  • Frecuencia de superación
  • Estimador de Kaplan-Meier
  • Tiempo medio para fallar
  • Tiempo de residencia (estadísticas)
  • Curva de supervivencia

Referencias [ editar ]

  1. ↑ a b Kleinbaum, David G .; Klein, Mitchel (2012), Análisis de supervivencia: un texto de autoaprendizaje (tercera edición), Springer, ISBN 978-1441966452
  2. ^ Tableman, Mara; Kim, Jong Sung (2003), Survival Analysis Using S (Primera edición), Chapman y Hall / CRC, ISBN 978-1584884088
  3. ^ a b c Ebeling, Charles (2010), Introducción a la ingeniería de confiabilidad y mantenibilidad (segunda ed.), Waveland Press, ISBN 978-1577666257
  4. ^ Olkin, Ingram; Gleser, Leon; Derman, Cyrus (1994), Modelos de probabilidad y aplicaciones (Segunda ed.), Macmillan, ISBN 0-02-389220-X
  5. ^ Klein, John; Moeschberger, Melvin (2005), Survival Analysis: Techniques for Censored and Truncated Data (Segunda ed.), Springer, ISBN 978-0387953991 CS1 maint: discouraged parameter (link)
  6. ^ Mendenhall, William; Terry, Sincich (2007), Estadística para la ingeniería y las ciencias (Quinta ed.), Pearson / Prentice Hall, ISBN 978-0131877061
  7. ^ Brostrom, Göran (2012), Análisis del historial de eventos con R (Primera edición), Chapman & Hall / CRC, ISBN 978-1439831649
  8. ^ Efron, Bradley; Hastie, Trevor (2016), Inferencia estadística de la era informática: algoritmos, evidencia y ciencia de datos (primera edición), Cambridge University Press, ISBN 978-1107149892
  9. ^ Lawless, Jerald (2002), Modelos estadísticos y métodos para datos de por vida (Segunda ed.), Wiley, ISBN 978-0471372158