En la teoría de la decisión , el valor esperado de la información de la muestra (EVSI) es el aumento esperado en la utilidad que un tomador de decisiones podría obtener al obtener acceso a una muestra de observaciones adicionales antes de tomar una decisión. La información adicional obtenida de la muestra puede permitirles tomar una decisión más informada y, por lo tanto, mejor, lo que resultará en un aumento de la utilidad esperada. EVSI intenta estimar cuál sería esta mejora antes de ver datos de muestra reales; por lo tanto, EVSI es una forma de lo que se conoce como análisis preposterior .
Formulación
Dejar
Es común (pero no esencial) en escenarios EVSI para , y , lo que quiere decir que cada observación es una lectura imparcial del sensor del estado subyacente , siendo cada lectura del sensor independiente y distribuida de forma idéntica.
La utilidad de la decisión óptima basada solo en la previa, sin hacer más observaciones, viene dada por
Si el tomador de decisiones pudiera tener acceso a una sola muestra, , la utilidad posterior óptima sería
dónde se obtiene de la regla de Bayes :
Dado que no saben qué muestra se obtendría realmente si se obtuviera una, deben promediar todas las muestras posibles para obtener la utilidad esperada dada una muestra:
El valor esperado de la información de la muestra se define entonces como
Cálculo
Rara vez es factible llevar a cabo la integración sobre el espacio de posibles observaciones en E [U | SI] analíticamente, por lo que el cálculo de EVSI generalmente requiere una simulación de Monte Carlo . El método implica simular aleatoriamente una muestra,, luego usándolo para calcular el posterior y maximizando la utilidad basada en . Todo este proceso luego se repite muchas veces, porpara obtener una muestra de Monte Carlo si las utilidades son óptimas. Estos se promedian para obtener la utilidad esperada dada una muestra hipotética.
Ejemplo
Una agencia reguladora debe decidir si aprueba un nuevo tratamiento. Antes de tomar la decisión final de aprobación / rechazo, preguntan cuál sería el valor de realizar un estudio de prueba adicional sobreasignaturas. Esta pregunta es respondida por el EVSI.
El diagrama muestra un diagrama de influencia para calcular el EVSI en este ejemplo.
El modelo clasifica el resultado de cualquier tema en una de cinco categorías:
- {"Curación", "Mejora", "Ineficaz", "Efecto secundario leve", "Efecto secundario grave"}
Y para cada uno de estos resultados, asigna una utilidad igual a un valor monetario estimado equivalente al paciente del resultado.
Un estado de decisión, en este ejemplo es un vector de cinco números entre 0 y 1 que suman 1, dando la proporción de pacientes futuros que experimentarán cada uno de los cinco posibles resultados. Por ejemplo, un estado denota el caso en el que el 5% de los pacientes se cura, el 60% mejora, el 20% considera que el tratamiento es ineficaz, el 10% experimenta efectos secundarios leves y el 5% experimenta efectos secundarios peligrosos.
El anterior, se codifica utilizando una distribución de Dirichlet , que requiere cinco números (que no suman 1) cuyos valores relativos capturan la proporción relativa esperada de cada resultado, y cuya suma codifica la fuerza de esta creencia previa. En el diagrama, los parámetros de la distribución de Dirichlet están contenidos en la variable dirichlet alpha prior , mientras que la distribución previa en sí está en la variable de azar Prior . El gráfico de densidad de probabilidad de los marginales se muestra aquí:
En la variable aleatoria Datos de prueba, los datos de prueba se simulan como una muestra de Monte Carlo a partir de una distribución multinomial . Por ejemplo, cuando Trial_size = 100, cada muestra de Monte Carlo de Trial_data contiene un vector que suma 100 y muestra el número de sujetos en el estudio simulado que experimentaron cada uno de los cinco resultados posibles. La siguiente tabla de resultados muestra los primeros 8 resultados del ensayo simulado:
La combinación de los datos de este ensayo con un previo de Dirichlet solo requiere agregar las frecuencias de resultado a los valores alfa del anterior de Dirichlet, lo que da como resultado una distribución posterior de Dirichlet para cada ensayo simulado. Para cada uno de estos, la decisión de aprobar se toma en función de si la utilidad media es positiva, y utilizando una utilidad de cero cuando no se aprueba el tratamiento, se obtiene la utilidad Pre-posterior . Repitiendo el cálculo para un rango de posibles tamaños de prueba, se obtiene un EVSI en cada posible tamaño de prueba candidato como se muestra en este gráfico:
Antecedentes históricos
El libro de 1961 Applied Statistical Decision Theory [1] de Schlaifer y Raiffa fue uno de los primeros en utilizar EVSI extensamente.
El valor esperado de la información de la muestra (EVSI) es una relajación de la métrica del valor esperado de información perfecta (EVPI), que codifica el aumento de la utilidad que se obtendría si se aprendiera el verdadero estado subyacente,. Básicamente, EVPI indica el valor de la información perfecta, mientras que EVSI indica el valor de alguna información limitada e incompleta .
El valor esperado de incluir incertidumbre (EVIU) compara el valor de modelar información incierta en comparación con modelar una situación sin tener en cuenta la incertidumbre. Dado que el impacto de la incertidumbre en los resultados calculados a menudo se analiza utilizando métodos de Monte Carlo , EVIU parece ser muy similar al valor de realizar un análisis utilizando una muestra de Monte Carlo , que se asemeja mucho a la noción capturada con EVSI. Sin embargo, EVSI y EVIU son bastante distintos, una diferencia notable entre la forma en que EVSI utiliza la actualización bayesiana para incorporar la muestra simulada.
Ver también
Referencias
- ^ Schlaifer y Raiffa (1961), "Teoría de la decisión estadística aplicada"