Muestreo por transformada inversa

Transformada inversa de muestreo (también conocido como muestreo inversión , la probabilidad integral transformada inversa , el método de transformación inversa , Smirnov transformar , o la regla de oro ^[1] ) es un método básico para el muestreo de números pseudo-aleatorios , es decir, para la generación de números de muestra en aleatorio de cualquier distribución de probabilidad dada su función de distribución acumulativa .

El muestreo de transformación inversa toma muestras uniformes de un número ${\ Displaystyle u}$ entre 0 y 1, interpretado como una probabilidad, y luego devuelve el número más grande ${\ Displaystyle x}$ del dominio de la distribución ${\ Displaystyle P (X)}$ tal que ${\ Displaystyle P (- \ infty$ . Por ejemplo, imagina que ${\ Displaystyle P (X)}$ es la distribución normal estándar con media cero y desviación estándar uno. La siguiente tabla muestra muestras tomadas de la distribución uniforme y su representación en la distribución normal estándar.

Transformación de muestra uniforme a normal
${\ Displaystyle u}$	${\ Displaystyle F ^ {- 1} (u)}$
.5	0
.975	1.95996
.995	2.5758
.999999	4.75342
1-2 ^ {- 52}	8.12589

Muestreo por transformada inversa para distribución normal

Elegimos aleatoriamente una proporción del área bajo la curva y devolvemos el número en el dominio de manera que exactamente esta proporción del área se encuentre a la izquierda de ese número. Intuitivamente, es poco probable que elijamos un número en el extremo más alejado de las colas porque hay muy poca área en ellas que requeriría elegir un número muy cercano a cero o uno.

Computacionalmente, este método implica calcular la función cuantílica de la distribución; en otras palabras, calcular la función de distribución acumulativa (CDF) de la distribución (que asigna un número en el dominio a una probabilidad entre 0 y 1) y luego invertir esa función. Esta es la fuente del término "inverso" o "inversión" en la mayoría de los nombres de este método. Tenga en cuenta que para una distribución discreta , calcular la CDF en general no es demasiado difícil: simplemente sumamos las probabilidades individuales para los diversos puntos de la distribución. Sin embargo, para una distribución continua , necesitamos integrar la función de densidad de probabilidad (PDF) de la distribución, lo cual es imposible de hacer analíticamente para la mayoría de las distribuciones (incluida la distribución normal ). Como resultado, este método puede ser computacionalmente ineficiente para muchas distribuciones y se prefieren otros métodos; sin embargo, es un método útil para construir muestreadores de aplicación más general, como los basados en el muestreo de rechazo .

Para la distribución normal , la falta de una expresión analítica para la función cuantil correspondiente significa que otros métodos (por ejemplo, la transformada de Box-Muller ) pueden ser preferidos computacionalmente. A menudo ocurre que, incluso para distribuciones simples, el método de muestreo por transformada inversa puede mejorarse en: ^[2] ver, por ejemplo, el algoritmo zigurat y el muestreo de rechazo . Por otro lado, es posible aproximar la función cuantílica de la distribución normal con extrema precisión utilizando polinomios de grado moderado y, de hecho, el método para hacerlo es lo suficientemente rápido como para que el muestreo por inversión sea ahora el método predeterminado para el muestreo de una distribución normal. en el paquete estadístico R . ^[3]

Definición

La transformada integral de probabilidad establece que si ${\ Displaystyle X}$ es una variable aleatoria continua con función de distribución acumulativa ${\ Displaystyle F_ {X}}$ , luego la variable aleatoria ${\ Displaystyle Y = F_ {X} (X)}$ tiene una distribución uniforme en [0, 1]. La transformada integral de probabilidad inversa es justamente la inversa de esto: específicamente, si ${\ Displaystyle Y}$ tiene una distribución uniforme en [0, 1] y si ${\ Displaystyle X}$ tiene una distribución acumulativa ${\ Displaystyle F_ {X}}$ , luego la variable aleatoria ${\ Displaystyle F_ {X} ^ {- 1} (Y)}$ tiene la misma distribución que ${\ Displaystyle X}$ .

Gráfico de la técnica de inversión de

{\ Displaystyle x}

a

{\ Displaystyle F (x)}

. En la parte inferior derecha vemos la función regular y en la parte superior izquierda su inversión.

Intuición

De ${\ Displaystyle U \ sim \ mathrm {Unif} [0,1]}$ , queremos generar ${\ Displaystyle X}$ con CDF ${\ Displaystyle F_ {X} (x).}$ Asumimos ${\ Displaystyle F_ {X} (x)}$ ser una función estrictamente creciente, lo que proporciona una buena intuición.

Queremos ver si podemos encontrar alguna transformación estrictamente monótona. ${\ Displaystyle T: [0,1] \ mapsto \ mathbb {R}}$ , tal que ${\ Displaystyle T (U) {\ overset {d} {=}} X}$ . Tendremos

${\ Displaystyle F_ {X} (x) = \ Pr (X \ leq x) = \ Pr (T (U) \ leq x) = \ Pr (U \ leq T ^ {- 1} (x)) = T ^ {- 1} (x), {\ text {para}} x \ in \ mathbb {R},}$

donde el último paso usó eso ${\ Displaystyle \ Pr (U \ leq y) = y}$ Cuándo ${\ Displaystyle U}$ es uniforme en ${\ Displaystyle (0,1)}$ .

Así que tenemos ${\ Displaystyle F_ {X}}$ ser la función inversa de ${\ Displaystyle T}$ , o equivalente ${\ Displaystyle T (u) = F_ {X} ^ {- 1} (u), u \ en [0,1].}$

Por tanto, podemos generar ${\ Displaystyle X}$ de ${\ Displaystyle F_ {X} ^ {- 1} (U).}$

El método

Esquema del muestreo por transformada inversa. La función inversa de

{\ Displaystyle y = F_ {X} (x)}

puede ser definido por

{\ Displaystyle F_ {X} ^ {- 1} (y) = \ mathrm {inf} \ {x | F_ {X} (x) \ geq y \}}

.

Una animación de cómo el muestreo por transformación inversa genera valores aleatorios distribuidos normalmente a partir de valores aleatorios distribuidos uniformemente

El problema que resuelve el método de muestreo por transformación inversa es el siguiente:

Dejar ${\ Displaystyle X}$ ser una variable aleatoria cuya distribución puede ser descrita por la función de distribución acumulativa ${\ Displaystyle F_ {X}}$ .
Queremos generar valores de ${\ Displaystyle X}$ que se distribuyen según esta distribución.

El método de muestreo por transformación inversa funciona de la siguiente manera:

Genera un número aleatorio ${\ Displaystyle u}$ de la distribución uniforme estándar en el intervalo ${\ Displaystyle [0,1]}$ , por ejemplo, de ${\ Displaystyle U \ sim \ mathrm {Unif} [0,1].}$
Encuentre la inversa del CDF deseado, p. Ej. ${\ Displaystyle F_ {X} ^ {- 1} (x)}$ .
Calcular ${\ Displaystyle X = F_ {X} ^ {- 1} (u)}$ . La variable aleatoria calculada ${\ Displaystyle X}$ tiene distribución ${\ Displaystyle F_ {X} (x)}$ .

Expresado de manera diferente, dada una variable uniforme continua ${\ Displaystyle U}$ en ${\ Displaystyle [0,1]}$ y una función de distribución acumulativa invertible ${\ Displaystyle F_ {X}}$ , la variable aleatoria ${\ Displaystyle X = F_ {X} ^ {- 1} (U)}$ tiene distribución ${\ Displaystyle F_ {X}}$ (o, ${\ Displaystyle X}$ esta distribuido ${\ Displaystyle F_ {X}}$ ).

Se puede dar un tratamiento de funciones inversas como objetos que satisfacen ecuaciones diferenciales. ^[4] Algunas de estas ecuaciones diferenciales admiten soluciones explícitas en series de potencia, a pesar de su no linealidad. ^{[ cita requerida ]}

Ejemplos de

Como ejemplo, supongamos que tenemos una variable aleatoria ${\ Displaystyle U \ sim \ mathrm {Unif} (0,1)}$ y una función de distribución acumulativa

{\ Displaystyle {\ begin {alineado} F (x) = 1- \ exp (- {\ sqrt {x}}) \ end {alineado}}}

Para realizar una inversión queremos resolver para

{\ Displaystyle F (F ^ {- 1} (u)) = u}

{\ Displaystyle {\ begin {alineado} F (F ^ {- 1} (u)) & = u \\ 1- \ exp \ left (- {\ sqrt {F ^ {- 1} (u)}} \ derecha) & = u \\ F ^ {- 1} (u) & = (- \ log (1-u)) ^ {2} \\ & = (\ log (1-u)) ^ {2} \ final {alineado}}}

A partir de aquí realizaríamos los pasos uno, dos y tres.

Como otro ejemplo, usamos la distribución exponencial con ${\ Displaystyle F_ {X} (x) = 1-e ^ {- \ lambda x}}$ para x ≥ 0 (y 0 en caso contrario). Resolviendo y = F (x) obtenemos la función inversa

{\ Displaystyle x = F ^ {- 1} (y) = - {\ frac {1} {\ lambda}} \ ln (1-y).}

Significa que si dibujamos algunos

{\ Displaystyle y_ {0}}

a partir de una

{\ Displaystyle U \ sim \ mathrm {Unif} (0,1)}

y calcular

{\ Displaystyle x_ {0} = F_ {X} ^ {- 1} (y_ {0}) = - {\ frac {1} {\ lambda}} \ ln (1-y_ {0}),}

Esto

{\ Displaystyle x_ {0}}

tiene distribución exponencial.

La idea se ilustra en el siguiente gráfico:

Los números aleatorios y _i se generan a partir de una distribución uniforme entre 0 y 1, es decir, Y ~ U (0, 1). Están dibujados como puntos de colores en el eje y. Cada uno de los puntos se asigna de acuerdo con x = F ⁻¹ (y), que se muestra con flechas grises para dos puntos de ejemplo. En este ejemplo, hemos utilizado una distribución exponencial. Por tanto, para x ≥ 0, la densidad de probabilidad es

{\ Displaystyle \ varrho _ {X} (x) = \ lambda e ^ {- \ lambda \, x}}

y la función de distribución acumulativa es

{\ Displaystyle F (x) = 1-e ^ {- \ lambda \, x}}

. Por lo tanto,

{\ Displaystyle x = F ^ {- 1} (y) = - {\ frac {\ ln (1-y)} {\ lambda}}}

. Podemos ver que al usar este método, muchos puntos terminan cerca de 0 y solo algunos puntos terminan teniendo valores altos de x, tal como se espera para una distribución exponencial.

Tenga en cuenta que la distribución no cambia si comenzamos con 1-y en lugar de y. Por lo tanto, para propósitos de cálculo, es suficiente generar números aleatorios y en [0, 1] y luego simplemente calcular

{\ Displaystyle x = F ^ {- 1} (y) = - {\ frac {1} {\ lambda}} \ ln (y).}

Prueba de corrección

Sea F una función de distribución acumulativa continua , y sea F ⁻¹ su función inversa (usando el mínimo porque los CDF son débilmente monótonos y continuos a la derecha ): ^[5]

{\ Displaystyle F ^ {- 1} (u) = \ inf \; \ {x \ mid F (x) \ geq u \} \ qquad (0

Afirmación: Si U es una variable aleatoria uniforme en (0, 1) entonces ${\ Displaystyle F ^ {- 1} (U)}$ tiene F como su CDF.

Prueba:

{\ Displaystyle {\ begin {alineado} & \ Pr (F ^ {- 1} (U) \ leq x) \\ & {} = \ Pr (U \ leq F (x)) \ quad & ({\ text {aplicando}} F, {\ text {a ambos lados}}) \\ & {} = F (x) \ quad & ({\ text {porque}} \ Pr (U \ leq y) = y, {\ texto {cuando U es uniforme en}} (0,1)) \\\ end {alineado}}}

Distribución truncada

El muestreo por transformada inversa se puede extender simplemente a casos de distribuciones truncadas en el intervalo ${\ Displaystyle (a, b]}$ sin el costo del muestreo de rechazo: se puede seguir el mismo algoritmo, pero en lugar de generar un número aleatorio ${\ Displaystyle u}$ distribuidos uniformemente entre 0 y 1, generan ${\ Displaystyle u}$ distribuido uniformemente entre ${\ Displaystyle F (a)}$ y ${\ Displaystyle F (b)}$ , y luego otra vez toma ${\ Displaystyle F ^ {- 1} (u)}$ .

Reducción del número de inversiones

Para obtener un gran número de muestras, es necesario realizar el mismo número de inversiones de la distribución. Una forma posible de reducir el número de inversiones mientras se obtiene una gran cantidad de muestras es la aplicación del denominado muestreador de Monte Carlo de colocación estocástica (muestreador SCMC) dentro de un marco de expansión de caos polinomial . Esto nos permite generar cualquier número de muestras de Monte Carlo con solo unas pocas inversiones de la distribución original con muestras independientes de una variable para la cual las inversiones están analíticamente disponibles, por ejemplo, la variable normal estándar. ^[6]

Ver también

Transformada integral de probabilidad
Cópula , definida mediante transformada integral de probabilidad.
Función cuantil , para la construcción explícita de CDF inversas.
Función de distribución inversa para una definición matemática precisa de distribuciones con componentes discretos.

Referencias

^ Universidad de Aalto, N. Hyvönen, Métodos computacionales en problemas inversos. Duodécima conferencia https://noppa.tkk.fi/noppa/kurssi/mat-1.3626/luennot/Mat-1_3626_lecture12.pdf ^{[ enlace muerto permanente ]}
^ Luc Devroye (1986). Generación de variables aleatorias no uniformes (PDF) . Nueva York: Springer-Verlag.
^ https://stat.ethz.ch/R-manual/R-devel/library/base/html/Random.html
^ Steinbrecher, G., Shaw, WT (2008). Mecánica cuantílica. Revista europea de matemáticas aplicadas 19 (2): 87-112.
^ Luc Devroye (1986). "Apartado 2.2. Inversión por solución numérica de F ( X ) = U " (PDF) . Generación variable aleatoria no uniforme . Nueva York: Springer-Verlag.
^ LA Grzelak, JAS Witteveen, M. Suarez y CW Oosterlee. El muestreador de Monte Carlo de colocación estocástica: muestreo altamente eficiente de distribuciones "costosas". https://ssrn.com/abstract=2529691

[aalto-1] Universidad de Aalto, N. Hyvönen, Métodos computacionales en problemas inversos. Duodécima conferencia https://noppa.tkk.fi/noppa/kurssi/mat-1.3626/luennot/Mat-1_3626_lecture12.pdf ^{[ enlace muerto permanente ]}

[2] Luc Devroye (1986). Generación de variables aleatorias no uniformes (PDF) . Nueva York: Springer-Verlag.

[3] ttps://stat.ethz.ch/R-manual/R-devel/library/base/html/Random.html

[4] Steinbrecher, G., Shaw, WT (2008). Mecánica cuantílica. Revista europea de matemáticas aplicadas 19 (2): 87-112.

[5] Luc Devroye (1986). "Apartado 2.2. Inversión por solución numérica de F ( X ) = U " (PDF) . Generación variable aleatoria no uniforme . Nueva York: Springer-Verlag.

[6] LA Grzelak, JAS Witteveen, M. Suarez y CW Oosterlee. El muestreador de Monte Carlo de colocación estocástica: muestreo altamente eficiente de distribuciones "costosas". https://ssrn.com/abstract=2529691

[1]