En estadística , la estimación de riesgo insesgada de Stein (SURE) es un estimador insesgado del error cuadrático medio de "un estimador sesgado no lineal, casi arbitrario". [1] En otras palabras, proporciona una indicación de la precisión de un estimador dado. Esto es importante ya que el verdadero error cuadrático medio de un estimador es una función del parámetro desconocido que se va a estimar y, por lo tanto, no se puede determinar con exactitud.
La técnica lleva el nombre de su descubridor, Charles Stein . [2]
Dejar
ser un parámetro desconocido y dejar
ser un vector de medición cuyos componentes son independientes y están distribuidos normalmente con media
y varianza
. Suponer
es un estimador de
de
y se puede escribir
, dónde
es débilmente diferenciable . Entonces, la estimación de riesgo no sesgada de Stein viene dada por [3]
![{\displaystyle \operatorname {SURE} (h)=d\sigma ^{2}+\|g(x)\|^{2}+2\sigma ^{2}\sum _{i=1}^{d}{\frac {\partial }{\partial x_{i}}}g_{i}(x)=-d\sigma ^{2}+\|g(x)\|^{2}+2\sigma ^{2}\sum _{i=1}^{d}{\frac {\partial }{\partial x_{i}}}h_{i}(x),}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
dónde
es el
th componente de la función
, y
es la norma euclidiana .
La importancia de SURE es que es una estimación insesgada del error cuadrático medio (o riesgo de error cuadrático) de
, es decir
![{\displaystyle \operatorname {E} _{\mu }\{\operatorname {SURE} (h)\}=\operatorname {MSE} (h),\,\!}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
con
![{\displaystyle \operatorname {MSE} (h)=\operatorname {E} _{\mu }\|h(x)-\mu \|^{2}.}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Por lo tanto, minimizar SURE puede actuar como un sustituto para minimizar el MSE. Tenga en cuenta que no hay dependencia del parámetro desconocido
en la expresión de SURE anterior. Por lo tanto, se puede manipular (por ejemplo, para determinar la configuración de estimación óptima) sin conocimiento de
.
Deseamos demostrar que
![{\displaystyle \operatorname {E} _{\mu }\|h(x)-\mu \|^{2}=\operatorname {E} _{\mu }\{\operatorname {SURE} (h)\}.}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Comenzamos expandiendo el MSE como
![{\displaystyle {\begin{aligned}\operatorname {E} _{\mu }\|h(x)-\mu \|^{2}&=\operatorname {E} _{\mu }\|g(x)+x-\mu \|^{2}\\&=\operatorname {E} _{\mu }\|g(x)\|^{2}+\operatorname {E} _{\mu }\|x-\mu \|^{2}+2\operatorname {E} _{\mu }g(x)^{T}(x-\mu )\\&=\operatorname {E} _{\mu }\|g(x)\|^{2}+d\sigma ^{2}+2\operatorname {E} _{\mu }g(x)^{T}(x-\mu ).\end{aligned}}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Ahora usamos la integración por partes para reescribir el último término:
![{\displaystyle {\begin{aligned}\operatorname {E} _{\mu }g(x)^{T}(x-\mu )&=\int _{{\mathbb {R} }^{d}}{\frac {1}{\sqrt {2\pi \sigma ^{2d}}}}\exp \left(-{\frac {\|x-\mu \|^{2}}{2\sigma ^{2}}}\right)\sum _{i=1}^{d}g_{i}(x)(x_{i}-\mu _{i})d^{d}x\\&=\sigma ^{2}\sum _{i=1}^{d}\int _{{\mathbb {R} }^{d}}{\frac {1}{\sqrt {2\pi \sigma ^{2d}}}}\exp \left(-{\frac {\|x-\mu \|^{2}}{2\sigma ^{2}}}\right){\frac {dg_{i}}{dx_{i}}}d^{d}x\\&=\sigma ^{2}\sum _{i=1}^{d}\operatorname {E} _{\mu }{\frac {dg_{i}}{dx_{i}}}.\end{aligned}}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Sustituyendo esto en la expresión del MSE, llegamos a
![{\displaystyle \operatorname {E} _{\mu }\|h(x)-\mu \|^{2}=\operatorname {E} _{\mu }\left(d\sigma ^{2}+\|g(x)\|^{2}+2\sigma ^{2}\sum _{i=1}^{d}{\frac {dg_{i}}{dx_{i}}}\right).}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Una aplicación estándar de SURE es elegir una forma paramétrica para un estimador y luego optimizar los valores de los parámetros para minimizar la estimación del riesgo. Esta técnica se ha aplicado en varios entornos. Por ejemplo, se puede derivar una variante del estimador de James-Stein encontrando el estimador de contracción óptimo . [2] La técnica también ha sido utilizada por Donoho y Johnstone para determinar el factor de contracción óptimo en una configuración de eliminación de ruido de ondas . [1]