Recuperación de isoline

La recuperación de isolíneas es un método inverso de detección remota que recupera una o más isolíneas de un componente o variable atmosférico traza. Cuando se utiliza para validar otro contorno, es el método más preciso posible para la tarea. Cuando se utiliza para recuperar un campo completo, es un método inverso no lineal general y un estimador robusto.

Para validar contornos advectados

Razón fundamental

Supongamos que tenemos, como en la advección de contornos , conocimiento inferido de un solo contorno o isolínea de un constituyente atmosférico, q y deseamos validar esto contra datos de teledetección satelital. Dado que los instrumentos satelitales no pueden medir el constituyente directamente, necesitamos realizar algún tipo de inversión. Para validar el contorno, no es necesario conocer, en un punto dado, el valor exacto del constituyente. Solo necesitamos saber si cae dentro o fuera, es decir, es mayor o menor que el valor del contorno, q ₀ .

Este es un problema de clasificación. Dejar:

{\ displaystyle j = {\ begin {cases} 1; & q

ser la variable discretizada. Esto estará relacionado con el vector de medición satelital , ${\ Displaystyle {\ vec {y}}}$ , por alguna probabilidad condicional, ${\ Displaystyle P ({\ vec {y}} | j)}$ , que aproximamos mediante la recopilación de muestras, llamadas datos de entrenamiento , tanto del vector de medición como de la variable de estado, q . Al generar resultados de clasificación sobre la región de interés y usar cualquier algoritmo de contorneado para separar las dos clases, la isolínea habrá sido "recuperada".

La precisión de una recuperación se obtendrá integrando la probabilidad condicional sobre el área de interés, A :

{\ Displaystyle a = {\ frac {1} {A}} \ int _ {A} P \ left [c ({\ vec {r}}) | {\ vec {y}} ({\ vec {r} }) \ derecha] \, d {\ vec {r}}}

donde c es la clase recuperada en la posición, ${\ Displaystyle {\ vec {r}}}$ . Podemos maximizar esta cantidad maximizando el valor del integrando en cada punto:

{\ Displaystyle \ max (a) = {\ frac {1} {A}} \ int _ {A} \ left \ lbrace \ max _ {j} P \ left [j | {\ vec {y}} ({ \ vec {r}}) \ right] \ right \ rbrace \, d {\ vec {r}}}

Dado que esta es la definición de máxima verosimilitud, un algoritmo de clasificación basado en la máxima verosimilitud es el método más preciso posible para validar un contorno advectado. Un buen método para realizar la clasificación de máxima verosimilitud a partir de un conjunto de datos de entrenamiento es la estimación de densidad de kernel variable .

Datos de entrenamiento

Hay dos métodos para generar los datos de entrenamiento. El más obvio es empíricamente, simplemente haciendo coincidir las mediciones de la variable, q , con las mediciones colocadas del instrumento satélite. En este caso, no se requiere ningún conocimiento de la física real que produce la medición y el algoritmo de recuperación es puramente estadístico. El segundo es con un modelo avanzado:

{\ Displaystyle {\ vec {y}} = {\ vec {f}} ({\ vec {x}}) \,}

dónde ${\ Displaystyle {\ vec {x}}}$ es el vector de estado y q = x _k es un solo componente. Una ventaja de este método es que los vectores de estado no necesitan reflejar las configuraciones atmosféricas reales, solo necesitan adoptar un estado que razonablemente podría ocurrir en la atmósfera real. Tampoco hay ninguno de los errores inherentes a la mayoría de los procedimientos de colocación , por ejemplo, debido a errores de compensación en las ubicaciones de las muestras emparejadas y diferencias en los tamaños de huella de los dos instrumentos. Sin embargo, dado que las recuperaciones estarán sesgadas hacia estados más comunes, las estadísticas deberían reflejar las del mundo real.

Caracterización de errores

Las probabilidades condicionales, ${\ Displaystyle P ({\ vec {y}} | j)}$ , proporcionan una excelente caracterización de errores, por lo que el algoritmo de clasificación debería devolverlos. Definimos la calificación de confianza reescalando la probabilidad condicional:

{\ Displaystyle C = {\ frac {n_ {c} P (c | {\ vec {y}}) - 1} {n_ {c} -1}}}

donde n _c es el número de clases (en este caso, dos). Si C es cero, entonces la clasificación es poco mejor que el azar, mientras que si es uno, entonces debería ser perfecta. Para transformar la calificación de confianza en una tolerancia estadística , la siguiente integral de línea se puede aplicar a una recuperación de isolínea para la que se conoce la isolínea verdadera:

{\ Displaystyle \ delta (C) = {\ frac {1} {l}} \ int _ {0} ^ {l} h (CC ^ {\ prime} ({\ vec {r}})) \, ds }

donde s es el camino, l es la longitud de la isolina y ${\ Displaystyle C ^ {\ prime}}$ es la confianza recuperada en función de la posición. Si bien parece que la integral debe evaluarse por separado para cada valor de la calificación de confianza, C , de hecho se puede hacer para todos los valores de C clasificando las calificaciones de confianza de los resultados, ${\ Displaystyle C ^ {\ prime}}$ . La función relaciona el valor umbral del índice de confianza para el que se aplica la tolerancia. Es decir, define una región que contiene una fracción de la verdadera isolina igual a la tolerancia.

Ejemplo: vapor de agua de AMSU

Tolerancia estadística versus calificación de confianza para la recuperación de isolina de vapor de agua.

La serie de instrumentos satelitales Advanced Microwave Sounding Unit (AMSU) está diseñada para detectar temperatura y vapor de agua. Tienen una alta resolución horizontal (tan solo 15 km) y, debido a que están montados en más de un satélite, se puede obtener una cobertura global completa en menos de un día. Los datos de entrenamiento se generaron utilizando el segundo método del Centro Europeo de Pronósticos Meteorológicos a Mediano Plazo (ECMWF), los datos ERA-40 alimentados a un modelo de transferencia radiativa rápida llamado RTTOV . La función, ${\ Displaystyle \ delta (C)}$ se ha generado a partir de recuperaciones simuladas y se muestra en la figura de la derecha. Luego, esto se usa para establecer la tolerancia del 90 por ciento en la figura siguiente sombreando todas las calificaciones de confianza a menos de 0,8. Por lo tanto, esperamos que la isolina verdadera se encuentre dentro del sombreado el 90 por ciento de las veces.

Isolina de vapor de agua obtenida de las mediciones de AMSU y comparada con el reanálisis de ECMWF.

Para recuperaciones continuas

Humedad específica frente a probabilidades condicionales de la recuperación de isolíneas de vapor de agua.

La recuperación de isolíneas también es útil para recuperar una variable continua y constituye un método inverso no lineal general . Tiene la ventaja tanto sobre una red neuronal como sobre métodos iterativos como la estimación óptima que invierte el modelo directo directamente, ya que no hay posibilidad de quedarse atascado en un mínimo local .

Hay varios métodos para reconstituir la variable continua a partir de la discretizada. Una vez que se ha recuperado un número suficiente de contornos, es sencillo interpolar entre ellos. Las probabilidades condicionales constituyen un buen sustituto del valor continuo.

Considere la transformación de un continuo a una variable discreta:

{\ Displaystyle P (1 | {\ vec {y}}) = \ int _ {- \ infty} ^ {q_ {0}} P (q | {\ vec {y}}) \, dq}

{\ Displaystyle P (2 | {\ vec {y}}) = \ int _ {q_ {0}} ^ {\ infty} P (q | {\ vec {y}}) \, dq}

Suponer que ${\ Displaystyle P (q | {\ vec {y}})}$ está dado por un gaussiano:

{\ Displaystyle P (q | {\ vec {y}}) = {\ frac {1} {{\ sqrt {2 \ pi}} \ sigma _ {q}}} \ exp \ left \ lbrace - {\ frac {\ left [q - {\ bar {q}} ({\ vec {y}}) \ right] ^ {2}} {2 \ sigma _ {q}}} \ right \ rbrace}

dónde ${\ Displaystyle {\ bar {q}}}$ es el valor esperado y ${\ Displaystyle \ sigma _ {q}}$ es la desviación estándar, entonces la probabilidad condicional está relacionada con la variable continua, q , por la función de error:

{\ Displaystyle R = P (2 | {\ vec {y}}) - P (1 | {\ vec {y}}) = \ mathrm {erf} \ left [{\ frac {q_ {0} - {\ barra {q}} ({\ vec {y}})} {{\ sqrt {2}} \ sigma _ {q}}} \ right]}

La figura muestra la probabilidad condicional frente a la humedad específica para el ejemplo de recuperación discutido anteriormente.

Como estimador robusto

La ubicación de q ₀ se encuentra estableciendo las probabilidades condicionales de las dos clases para que sean iguales:

{\ Displaystyle \ int _ {- \ infty} ^ {q_ {0}} P (q | {\ vec {y}}) \, dq = \ int _ {q_ {0}} ^ {\ infty} P ( q | {\ vec {y}}) \, dq}

En otras palabras, cantidades iguales del "momento de orden cero" se encuentran a cada lado de q ₀ . Este tipo de formulación es característico de un estimador robusto .

Referencias

Peter Mills (2009). "Recuperación de isolíneas: un método óptimo para la validación de contornos advectados" (PDF) . Informática y Geociencias . 35 (11): 2020–2031. arXiv : 1202.5659 . Bibcode : 2009CG ..... 35.2020M . doi : 10.1016 / j.cageo.2008.12.015 .

Peter Mills (2010). "Clasificación estadística eficiente de medidas satelitales" (PDF) . Revista Internacional de Percepción Remota . arXiv : 1202.2194 . doi : 10.1080 / 01431161.2010.507795 . Archivado desde el original (PDF) el 26 de abril de 2012 . Consultado el 28 de diciembre de 2011 .

enlaces externos

Software para recuperación de isolíneas