Estimador de Kaplan-Meier


El estimador de Kaplan-Meier , [1] [2] también conocido como estimador de límite de producto , es una estadística no paramétrica que se utiliza para estimar la función de supervivencia a partir de datos de por vida. En la investigación médica, a menudo se usa para medir la fracción de pacientes que viven durante un cierto período de tiempo después del tratamiento. En otros campos, los estimadores de Kaplan-Meier pueden usarse para medir el tiempo que las personas permanecen desempleadas después de perder el trabajo, [3] el tiempo hasta que fallan las partes de la máquina o cuánto tiempo permanecen las frutas carnosas en las plantas antes de ser retiradas. por frugívoros . El estimador lleva el nombre de Edward L. Kaplan.y Paul Meier , quienes enviaron manuscritos similares a la Revista de la Asociación Estadounidense de Estadística . [4] El editor de la revista, John Tukey , los convenció de combinar su trabajo en un solo artículo, que ha sido citado casi 61.000 veces desde su publicación en 1958. [5] [6]

El estimador de la función de supervivencia (la probabilidad de que la vida sea más larga que ) viene dado por:

con un momento en el que ocurrió al menos un evento, d i el número de eventos (por ejemplo, muertes) que ocurrieron en ese momento y las personas que se sabe que han sobrevivido (aún no han tenido un evento o han sido censuradas) hasta el momento .

Una gráfica del estimador de Kaplan-Meier es una serie de pasos horizontales decrecientes que, con un tamaño de muestra suficientemente grande, se aproxima a la función de supervivencia real para esa población. Se supone que el valor de la función de supervivencia entre distintas observaciones muestreadas sucesivas ("clics") es constante.

Una ventaja importante de la curva de Kaplan-Meier es que el método puede tener en cuenta algunos tipos de datos censurados , en particular la censura por la derecha , que ocurre si un paciente se retira de un estudio, se pierde durante el seguimiento o está vivo sin ningún evento. aparición en el último seguimiento. En la trama, pequeñas marcas verticales indican pacientes individuales cuyos tiempos de supervivencia han sido censurados por la derecha. Cuando no se produce truncamiento o censura, la curva de Kaplan-Meier es el complemento de la función de distribución empírica .

En las estadísticas médicas , una aplicación típica podría implicar la agrupación de pacientes en categorías, por ejemplo, aquellos con perfil de Gene A y aquellos con perfil de Gene B. En el gráfico, los pacientes con el gen B mueren mucho más rápido que los que tienen el gen A. Después de dos años, aproximadamente el 80% de los pacientes con el gen A sobreviven, pero menos de la mitad de los pacientes con el gen B.


Un ejemplo de una gráfica de Kaplan-Meier para dos condiciones asociadas con la supervivencia del paciente.