Valor esperado de la información de la muestra

En la teoría de la decisión , el valor esperado de la información de la muestra (EVSI) es el aumento esperado en la utilidad que un tomador de decisiones podría obtener al obtener acceso a una muestra de observaciones adicionales antes de tomar una decisión. La información adicional obtenida de la muestra puede permitirles tomar una decisión más informada y, por lo tanto, mejor, lo que resultará en un aumento de la utilidad esperada. EVSI intenta estimar cuál sería esta mejora antes de ver datos de muestra reales; por lo tanto, EVSI es una forma de lo que se conoce como análisis preposterior .

Formulación

Dejar

{\ displaystyle {\ begin {array} {ll} d \ in D & {\ mbox {la decisión que se toma, elegida del espacio}} D \\ x \ in X & {\ mbox {un estado incierto, con valor real en el espacio }} X \\ z \ in Z & {\ mbox {una muestra observada compuesta de}} n {\ mbox {observaciones}} \ langle z_ {1}, z_ {2}, .., z_ {n} \ rangle \ \ U (d, x) & {\ mbox {la utilidad de seleccionar la decisión}} d {\ mbox {from}} x \\ p (x) & {\ mbox {la distribución de probabilidad subjetiva previa (función de densidad) en} } x \\ p (z | x) & {\ mbox {la probabilidad previa condicional de observar la muestra}} z \ end {array}}}

Es común (pero no esencial) en escenarios EVSI para ${\ Displaystyle Z_ {i} = X}$ , ${\ Displaystyle p (z | x) = \ prod p (z_ {i} | x)}$ y ${\ Displaystyle \ int zp (z | x) dz = x}$ , lo que quiere decir que cada observación es una lectura imparcial del sensor del estado subyacente ${\ Displaystyle x}$ , siendo cada lectura del sensor independiente y distribuida de forma idéntica.

La utilidad de la decisión óptima basada solo en la previa, sin hacer más observaciones, viene dada por

{\ Displaystyle E [U] = \ max _ {d \ in D} ~ \ int _ {X} U (d, x) p (x) ~ dx.}

Si el tomador de decisiones pudiera tener acceso a una sola muestra, ${\ Displaystyle z}$ , la utilidad posterior óptima sería

{\ Displaystyle E [U | z] = \ max _ {d \ in D} ~ \ int _ {X} U (d, x) p (x | z) ~ dx}

dónde ${\ Displaystyle p (x | z)}$ se obtiene de la regla de Bayes :

{\ Displaystyle p (x | z) = {{p (z | x) p (x)} \ over {p (z)}};}

{\ Displaystyle p (z) = \ int p (z | x) p (x) ~ dx.}

Dado que no saben qué muestra se obtendría realmente si se obtuviera una, deben promediar todas las muestras posibles para obtener la utilidad esperada dada una muestra:

{\ Displaystyle E [U | SI] = \ int _ {Z} E [U | z] p (z) dz = \ int _ {Z} \ max _ {d \ in D} ~ \ int _ {X} U (d, x) p (z | x) p (x) ~ dx ~ dz.}

El valor esperado de la información de la muestra se define entonces como

{\ Displaystyle {\ begin {array} {rl} EVSI & = E [U | SI] -E [U] \\ & = \ left (\ int _ {Z} \ max _ {d \ in D} ~ \ int _ {X} U (d, x) p (z | x) p (x) ~ dx ~ dz \ right) - \ left (\ max _ {d \ in D} ~ \ int _ {X} U (d , x) p (x) ~ dx \ right). \ end {matriz}}}

Cálculo

Rara vez es factible llevar a cabo la integración sobre el espacio de posibles observaciones en E [U | SI] analíticamente, por lo que el cálculo de EVSI generalmente requiere una simulación de Monte Carlo . El método implica simular aleatoriamente una muestra, ${\ Displaystyle z ^ {i} = \ langle z_ {1} ^ {i}, z_ {2} ^ {i}, .., z_ {n} ^ {i} \ rangle}$ , luego usándolo para calcular el posterior ${\ Displaystyle p (x | z ^ {i})}$ y maximizando la utilidad basada en ${\ Displaystyle p (x | z ^ {i})}$ . Todo este proceso luego se repite muchas veces, por ${\ Displaystyle i = 1, .., M}$ para obtener una muestra de Monte Carlo si las utilidades son óptimas. Estos se promedian para obtener la utilidad esperada dada una muestra hipotética.

Ejemplo

Una agencia reguladora debe decidir si aprueba un nuevo tratamiento. Antes de tomar la decisión final de aprobación / rechazo, preguntan cuál sería el valor de realizar un estudio de prueba adicional sobre ${\ Displaystyle n}$ asignaturas. Esta pregunta es respondida por el EVSI.

diagrama del modelo EVSI

El diagrama muestra un diagrama de influencia para calcular el EVSI en este ejemplo.

El modelo clasifica el resultado de cualquier tema en una de cinco categorías:

{\ Displaystyle Z_ {i} =}

{"Curación", "Mejora", "Ineficaz", "Efecto secundario leve", "Efecto secundario grave"}

Y para cada uno de estos resultados, asigna una utilidad igual a un valor monetario estimado equivalente al paciente del resultado.

Un estado de decisión, ${\ Displaystyle x}$ en este ejemplo es un vector de cinco números entre 0 y 1 que suman 1, dando la proporción de pacientes futuros que experimentarán cada uno de los cinco posibles resultados. Por ejemplo, un estado ${\ Displaystyle x = [5 \%, 60 \%, 20 \%, 10 \%, 5 \%]}$ denota el caso en el que el 5% de los pacientes se cura, el 60% mejora, el 20% considera que el tratamiento es ineficaz, el 10% experimenta efectos secundarios leves y el 5% experimenta efectos secundarios peligrosos.

El anterior, ${\ Displaystyle p (x)}$ se codifica utilizando una distribución de Dirichlet , que requiere cinco números (que no suman 1) cuyos valores relativos capturan la proporción relativa esperada de cada resultado, y cuya suma codifica la fuerza de esta creencia previa. En el diagrama, los parámetros de la distribución de Dirichlet están contenidos en la variable dirichlet alpha prior , mientras que la distribución previa en sí está en la variable de azar Prior . El gráfico de densidad de probabilidad de los marginales se muestra aquí:

EVSI prior marginals.png

En la variable aleatoria Datos de prueba, los datos de prueba se simulan como una muestra de Monte Carlo a partir de una distribución multinomial . Por ejemplo, cuando Trial_size = 100, cada muestra de Monte Carlo de Trial_data contiene un vector que suma 100 y muestra el número de sujetos en el estudio simulado que experimentaron cada uno de los cinco resultados posibles. La siguiente tabla de resultados muestra los primeros 8 resultados del ensayo simulado:

EVSI trial data.png

La combinación de los datos de este ensayo con un previo de Dirichlet solo requiere agregar las frecuencias de resultado a los valores alfa del anterior de Dirichlet, lo que da como resultado una distribución posterior de Dirichlet para cada ensayo simulado. Para cada uno de estos, la decisión de aprobar se toma en función de si la utilidad media es positiva, y utilizando una utilidad de cero cuando no se aprueba el tratamiento, se obtiene la utilidad Pre-posterior . Repitiendo el cálculo para un rango de posibles tamaños de prueba, se obtiene un EVSI en cada posible tamaño de prueba candidato como se muestra en este gráfico:

EVSI result.png

Antecedentes históricos

El libro de 1961 Applied Statistical Decision Theory ^[1] de Schlaifer y Raiffa fue uno de los primeros en utilizar EVSI extensamente.

Comparación con medidas relacionadas

El valor esperado de la información de la muestra (EVSI) es una relajación de la métrica del valor esperado de información perfecta (EVPI), que codifica el aumento de la utilidad que se obtendría si se aprendiera el verdadero estado subyacente, ${\ Displaystyle x}$ . Básicamente, EVPI indica el valor de la información perfecta, mientras que EVSI indica el valor de alguna información limitada e incompleta .

El valor esperado de incluir incertidumbre (EVIU) compara el valor de modelar información incierta en comparación con modelar una situación sin tener en cuenta la incertidumbre. Dado que el impacto de la incertidumbre en los resultados calculados a menudo se analiza utilizando métodos de Monte Carlo , EVIU parece ser muy similar al valor de realizar un análisis utilizando una muestra de Monte Carlo , que se asemeja mucho a la noción capturada con EVSI. Sin embargo, EVSI y EVIU son bastante distintos, una diferencia notable entre la forma en que EVSI utiliza la actualización bayesiana para incorporar la muestra simulada.

Ver también

Valor esperado de información perfecta (EVPI)
Valor esperado de incluir incertidumbre (EVIU)

Referencias

^ Schlaifer y Raiffa (1961), "Teoría de la decisión estadística aplicada"

[1] Schlaifer y Raiffa (1961), "Teoría de la decisión estadística aplicada"

[1]