Puntuación de riesgo


El puntaje de riesgo (o puntaje de riesgo) es el nombre que se le da a una práctica general en estadística aplicada , bioestadística , econometría y otras disciplinas relacionadas, consistente en crear un número fácilmente calculado (el puntaje ) que refleja el nivel de riesgo en presencia de algún factores de riesgo (por ejemplo, riesgo de mortalidad o enfermedad en presencia de síntomas o perfil genético, riesgo de pérdida financiera teniendo en cuenta el historial crediticio y financiero, etc.).

Los elementos 1 y 2 se pueden lograr mediante el uso de alguna forma de regresión , que proporcionará tanto la estimación del riesgo como la fórmula para calcular la puntuación. El punto 3 requiere establecer un conjunto arbitrario de umbrales y, por lo general, involucrará la opinión de expertos.

La puntuación de riesgo está diseñada para representar una probabilidad subyacente de un evento adverso indicado dado un vector de variables explicativas que contienen mediciones de los factores de riesgo relevantes. Para establecer la conexión entre los factores de riesgo y la probabilidad estimamos un conjunto de pesos utilizando un modelo lineal generalizado :

Donde es una función monótonamente creciente de valor real que asigna los valores del predictor lineal al intervalo . Los métodos GLM suelen utilizar logit o probit como función de enlace .

Si bien es posible estimar usando otros métodos estadísticos o de aprendizaje automático, los requisitos de simplicidad y fácil interpretación (y monotonicidad por factor de riesgo) hacen que la mayoría de estos métodos sean difíciles de usar para calificar en este contexto:

Al utilizar GLM, el conjunto de ponderaciones estimadas se puede utilizar para asignar diferentes valores (o "puntos") a diferentes valores de los factores de riesgo en (continuos o nominales como indicadores). La puntuación se puede expresar como una suma ponderada: