Difusión anisotrópica

En el procesamiento de imágenes y la visión por computadora , la difusión anisotrópica , también llamada difusión de Perona-Malik , es una técnica que tiene como objetivo reducir el ruido de la imagen sin eliminar partes significativas del contenido de la imagen, generalmente bordes, líneas u otros detalles que son importantes para la interpretación de la imagen. . ^[1]^[2]^{[3] La} difusión anisotrópica se asemeja al proceso que crea un espacio de escala , donde una imagen genera una familia parametrizada de imágenes sucesivamente cada vez más borrosas a partir de un proceso de difusión . Cada una de las imágenes resultantes en esta familia se dan como una convoluciónentre la imagen y un filtro gaussiano isotrópico 2D , donde el ancho del filtro aumenta con el parámetro. Este proceso de difusión es una transformación lineal e invariante en el espacio de la imagen original. La difusión anisotrópica es una generalización de este proceso de difusión: produce una familia de imágenes parametrizadas, pero cada imagen resultante es una combinación entre la imagen original y un filtro que depende del contenido local de la imagen original. Como consecuencia, la difusión anisotrópica es una transformación no lineal y variante espacial de la imagen original.

En su formulación original, presentada por Perona y Malik en 1987, ^[1] el filtro de variante espacial es de hecho isótropo, pero depende del contenido de la imagen de manera que se aproxima a una función de impulso cercana a los bordes y otras estructuras que deben conservarse en el imagen sobre los diferentes niveles del espacio de escala resultante . Esta formulación fue denominada difusión anisotrópica por Perona y Malik a pesar de que el filtro adaptado localmente es isotrópico, pero también ha sido referida como difusión no homogénea y no lineal ^[4] o difusión Perona-Malik ^[5] por otros autores. Una formulación más general permite que el filtro adaptado localmente sea verdaderamente anisotrópico cerca de estructuras lineales tales como bordes o líneas: tiene una orientación dada por la estructura tal que se alarga a lo largo de la estructura y se estrecha a lo largo. Dichos métodos se denominan suavizado adaptado a la forma ^[6]^[7] o difusión que mejora la coherencia . ^[8] Como consecuencia, las imágenes resultantes preservan las estructuras lineales mientras que al mismo tiempo se suaviza a lo largo de estas estructuras. Ambos casos pueden describirse mediante una generalización de la ecuación de difusión habitual donde el coeficiente de difusión, en lugar de ser un escalar constante, es una función de la posición de la imagen y asume un valor de matriz (o tensor ) (ver tensor de estructura ).

Aunque la familia de imágenes resultante puede describirse como una combinación entre la imagen original y los filtros de variantes espaciales, el filtro adaptado localmente y su combinación con la imagen no tienen que realizarse en la práctica. La difusión anisotrópica se implementa normalmente mediante una aproximación de la ecuación de difusión generalizada: cada nueva imagen de la familia se calcula aplicando esta ecuación a la imagen anterior. En consecuencia, la difusión anisotrópica es un proceso iterativo en el que se utiliza un conjunto de cálculos relativamente simple para calcular cada imagen sucesiva de la familia y este proceso se continúa hasta que se obtiene un grado suficiente de suavizado.

Definicion formal

Formalmente, deja ${\ Displaystyle \ Omega \ subconjunto \ mathbb {R} ^ {2}}$ denotar un subconjunto del plano y ${\ Displaystyle I (\ cdot, t): \ Omega \ rightarrow \ mathbb {R}}$ Sea una familia de imágenes en escala de grises. ${\ Displaystyle I (\ cdot, 0)}$ es la imagen de entrada. Entonces la difusión anisotrópica se define como

{\ Displaystyle {\ frac {\ I parcial} {\ parcial t}} = \ mathrm {div} \ left (c (x, y, t) \ nabla I \ right) = \ nabla c \ cdot \ nabla I + c (x, y, t) \ Delta I}

dónde ${\ Displaystyle \ Delta}$ denota el laplaciano , ${\ Displaystyle \ nabla}$ denota el gradiente , ${\ Displaystyle \ mathrm {div} (\ dots)}$ es el operador de divergencia y ${\ Displaystyle c (x, y, t)}$ es el coeficiente de difusión.

Para ${\ Displaystyle t> 0}$ , la imagen de salida está disponible como ${\ Displaystyle I (\ cdot, t)}$ , con mayor ${\ Displaystyle t}$ produciendo imágenes más borrosas.

${\ Displaystyle c (x, y, t)}$ controla la velocidad de difusión y generalmente se elige en función del gradiente de la imagen para preservar los bordes de la imagen. Pietro Perona y Jitendra Malik fueron pioneros en la idea de difusión anisotrópica en 1990 y propusieron dos funciones para el coeficiente de difusión:

{\ Displaystyle c \ left (\ | \ nabla I \ | \ right) = e ^ {- \ left (\ | \ nabla I \ | / K \ right) ^ {2}}}

y

{\ Displaystyle c \ left (\ | \ nabla I \ | \ right) = {\ frac {1} {1+ \ left ({\ frac {\ | \ nabla I \ |} {K}} \ right) ^ {2}}}}

la constante K controla la sensibilidad a los bordes y generalmente se elige de manera experimental o en función del ruido en la imagen.

Motivación

Dejar ${\ Displaystyle M}$ denotar la variedad de imágenes suaves, entonces las ecuaciones de difusión presentadas anteriormente se pueden interpretar como las ecuaciones de descenso de gradiente para la minimización de la energía funcional ${\ Displaystyle E: M \ rightarrow \ mathbb {R}}$ definido por

{\ Displaystyle E [I] = {\ frac {1} {2}} \ int _ {\ Omega} g \ left (\ | \ nabla I (x) \ | ^ {2} \ right) \, dx}

dónde ${\ Displaystyle g: \ mathbb {R} \ rightarrow \ mathbb {R}}$ es una función de valor real que está íntimamente relacionada con el coeficiente de difusión. Luego, para cualquier función de prueba infinitamente diferenciable con soporte compacto ${\ Displaystyle h}$ ,

{\ Displaystyle {\ begin {alineado} \ left. {\ frac {d} {dt}} \ right | _ {t = 0} E [I + th] & = {\ frac {d} {dt}} { \ big |} _ {t = 0} {\ frac {1} {2}} \ int _ {\ Omega} g \ left (\ | \ nabla (I + th) (x) \ | ^ {2} \ derecha) \, dx \\ & = \ int _ {\ Omega} g '\ izquierda (\ | \ nabla I (x) \ | ^ {2} \ derecha) \ nabla I \ cdot \ nabla h \, dx \ \ & = - \ int _ {\ Omega} \ mathrm {div} (g '\ left (\ | \ nabla I (x) \ | ^ {2} \ right) \ nabla I) h \, dx \ end { alineado}}}

donde la última línea se sigue de la integración multidimensional por partes. Dejando ${\ Displaystyle \ nabla E_ {I}}$ denotar el gradiente de E con respecto a la ${\ Displaystyle L ^ {2} (\ Omega, \ mathbb {R})}$ producto interno evaluado en I, esto da

{\ Displaystyle \ nabla E_ {I} = - \ mathrm {div} (g '\ left (\ | \ nabla I (x) \ | ^ {2} \ right) \ nabla I)}

Por lo tanto, las ecuaciones de descenso de gradiente en el funcional E están dadas por

{\ Displaystyle {\ frac {\ I parcial} {\ parcial t}} = - \ nabla E_ {I} = \ mathrm {div} (g '\ left (\ | \ nabla I (x) \ | ^ {2 } \ right) \ nabla I)}

Así al dejar ${\ Displaystyle c = g '}$ Se obtienen las ecuaciones de difusión anisotrópica.

Problema de mala postura

Coeficiente de difusión, ${\ Displaystyle c (x, y, t)}$ , que es propuesto por Perona y Malik puede ser un valor negativo cuando ${\ Displaystyle \ paralelo \ nabla I \ paralelo ^ {2}> K ^ {2}}$ . A partir de aquí, el sistema está restringido por una dimensión por simplicidad. Si la función de flujo se define como ${\ Displaystyle \ Phi (s): = g (| s | ^ {2}) s}$ , dónde ${\ Displaystyle s = \ nabla I (x, t)}$ y ${\ Displaystyle g (| s | ^ {2}) = {1 \ over 1 + s ^ {2} / K ^ {2}}}$ , entonces el

La ecuación de Perona-Malik se puede reescribir en función de la función de flujo mediante

${\ estilo de exhibición \ parcial _ {t} yo = \ nabla \ cdot \ Phi (s) = \ parcial _ {x} (\ Phi (\ parcial _ {x} yo)) = \ Phi '(\ parcial _ {x } I) \ parcial _ {xx} I}$ . Aquí, ${\ estilo de visualización \ parcial _ {t}, \ parcial _ {x}, \ parcial _ {xx}}$ se indican mediante la primera derivada de tiempo, posición y segunda derivada de posición, respectivamente.

Ahora, está claro que ${\ Displaystyle \ Phi '(\ parcial _ {x} I)}$ juega un papel en el coeficiente de difusión de la ecuación de calor lineal. Calculando ${\ Displaystyle \ Phi '(\ parcial _ {x} I)}$ ,

${\ Displaystyle \ Phi '(\ parcial _ {x} I) = {\ parcial \ sobre \ parcial s} {\ biggl (} {s \ over 1 + s ^ {2} / K ^ {2}} {\ biggr)} = {1-s ^ {2} / K ^ {2} \ over 1 + s ^ {2} / K ^ {2}}}$ .

Si ${\ Displaystyle 1-s ^ {2} / K ^ {2} <0}$ , el coeficiente de difusión se vuelve negativo y conduce a una difusión hacia atrás que mejora los contrastes de la intensidad de la imagen en lugar de suavizarlos en el procesamiento de la imagen.

En términos de perspectiva teórica, la difusión hacia atrás no solo es físicamente antinatural, sino que también da soluciones numéricamente inestables que son muy sensibles a los parámetros ( ${\ Displaystyle K}$ ). Además, se sabe que la difusión hacia atrás tiene numerosas soluciones y esto se denomina problema de mala situación.

Para evitar el problema, la regularización es necesaria y la gente ha demostrado que las regularizaciones espaciales conducen a una solución de estado estable convergente y constante. ^[9]

Regularización

El modelo de Perona-Malik modificado ^[10] (que también se conoce como regularización de la ecuación de PM) se discutirá en esta sección. En este enfoque, la incógnita se convoluciona con un gaussiano dentro de la no linealidad para obtener la ecuación de Perona-Malik modificada

{\ Displaystyle {\ frac {\ I parcial} {\ parcial t}} = \ mathrm {div} \ left (c (| DG _ {\ sigma} * I |) \ nabla I \ right)}

Dónde ${\ Displaystyle G _ {\ sigma} = C {\ sigma} ^ {- \ left (1/2 \ right)} \ exp \ left (- | x | ^ {2} / 4 {\ sigma} \ right)}$ .

La buena posición de la ecuación se puede lograr mediante la regularización, pero también introduce un efecto de desenfoque, que es el principal inconveniente de la regularización. Se requiere un conocimiento previo del nivel de ruido ya que de él depende la elección del parámetro de regularización.

Aplicaciones

La difusión anisotrópica se puede utilizar para eliminar el ruido de las imágenes digitales sin difuminar los bordes. Con un coeficiente de difusión constante, las ecuaciones de difusión anisotrópica se reducen a la ecuación de calor que es equivalente al desenfoque gaussiano. Esto es ideal para eliminar el ruido, pero también difumina indiscriminadamente los bordes. Cuando se elige el coeficiente de difusión como una función de búsqueda de bordes, como en Perona-Malik, las ecuaciones resultantes fomentan la difusión (por lo tanto, suavizan) dentro de las regiones y la prohíben a través de bordes fuertes. Por lo tanto, los bordes se pueden conservar mientras se elimina el ruido de la imagen.

En la misma línea que la eliminación de ruido, la difusión anisotrópica se puede utilizar en algoritmos de detección de bordes. Al ejecutar la difusión con un coeficiente de difusión de búsqueda de bordes para un cierto número de iteraciones, la imagen puede evolucionar hacia una imagen constante por partes con los límites entre los componentes constantes que se detectan como bordes.

Ver también

Referencias

↑ a b Pietro Perona y Jitendra Malik (noviembre de 1987). "Detección de bordes y espacios de escala mediante difusión anisotrópica". Actas del Taller de IEEE Computer Society sobre Visión por Computador . págs. 16-22.
^ Pietro Perona y Jitendra Malik (julio de 1990). "Escala-espacio y detección de bordes mediante difusión anisotrópica" (PDF) . Transacciones IEEE sobre análisis de patrones e inteligencia de máquinas . 12 (7): 629–639. doi : 10.1109 / 34.56205 .
^ Guillermo Sapiro (2001). Ecuaciones diferenciales parciales geométricas y análisis de imágenes . Prensa de la Universidad de Cambridge. pag. 223. ISBN 978-0-521-79075-8.
^ Joachim Weickert (julio de 1997). "Una revisión del filtrado de difusión no lineal". Teoría del espacio-escala en visión artificial . Springer, LNCS 1252. págs. 1–28. doi : 10.1007 / 3-540-63167-4 .
^ Bernd Jähne y Horst Haußecker (2000). Visión por computadora y aplicaciones, una guía para estudiantes y profesionales . Prensa académica. ISBN 978-0-13-085198-7.
^ Lindeberg, T., Escala-Espacio Teoría de la Visión por Computador, Kluwer Academic Publishers, 1994 , ISBN 0-7923-9418-6 , (capítulo 15).
^ Andrés Almansa y Tony Lindeberg (2000). "Mejora de huellas dactilares por adaptación de forma de operadores de espacio de escala con selección automática de escala" . Transacciones IEEE sobre procesamiento de imágenes . 9 (12): 2027-2042. Código Bibliográfico : 2000ITIP .... 9.2027L . doi : 10.1109 / 83.887971 . PMID 18262941 .
^ Weickert, J Difusión anisotrópica en el procesamiento de imágenes, Teuber Verlag, Stuttgart, 1998.
^ Weickert, Joachim. "Una revisión del filtrado de difusión no lineal". Congreso Internacional sobre Teorías del Espacio-Escala en Visión por Computador. Springer, Berlín, Heidelberg, 1997
^ Guidotti, P Algunas difusiones anisotrópicas, 2009.

enlaces externos

Función Mathematica PeronaMalikFilter .
Paquete de difusión anisotrópica no lineal IDL (mejora de bordes y mejora de coherencia): [1]

[Perona-Malik-1987-1] Pietro Perona y Jitendra Malik (noviembre de 1987). "Detección de bordes y espacios de escala mediante difusión anisotrópica". Actas del Taller de IEEE Computer Society sobre Visión por Computador . págs. 16-22.

[Perona-Malik-1990-2] Pietro Perona y Jitendra Malik (julio de 1990). "Escala-espacio y detección de bordes mediante difusión anisotrópica" (PDF) . Transacciones IEEE sobre análisis de patrones e inteligencia de máquinas . 12 (7): 629–639. doi : 10.1109 / 34.56205 .

[Sapiro-2001-3] Guillermo Sapiro (2001). Ecuaciones diferenciales parciales geométricas y análisis de imágenes . Prensa de la Universidad de Cambridge. pag. 223. ISBN 978-0-521-79075-8.

[Weickert-review-4] Joachim Weickert (julio de 1997). "Una revisión del filtrado de difusión no lineal". Teoría del espacio-escala en visión artificial . Springer, LNCS 1252. págs. 1–28. doi : 10.1007 / 3-540-63167-4 .

[Jähne-Haußecker-2000-5] Bernd Jähne y Horst Haußecker (2000). Visión por computadora y aplicaciones, una guía para estudiantes y profesionales . Prensa académica. ISBN 978-0-13-085198-7.

[lin94-6] Lindeberg, T., Escala-Espacio Teoría de la Visión por Computador, Kluwer Academic Publishers, 1994 , ISBN 0-7923-9418-6 , (capítulo 15).

[AlmLin00-7] Andrés Almansa y Tony Lindeberg (2000). "Mejora de huellas dactilares por adaptación de forma de operadores de espacio de escala con selección automática de escala" . Transacciones IEEE sobre procesamiento de imágenes . 9 (12): 2027-2042. Código Bibliográfico : 2000ITIP .... 9.2027L . doi : 10.1109 / 83.887971 . PMID 18262941 .

[Weickert-1998-8] Weickert, J Difusión anisotrópica en el procesamiento de imágenes, Teuber Verlag, Stuttgart, 1998.

[Weickert,Joachim-1997-9] Weickert, Joachim. "Una revisión del filtrado de difusión no lineal". Congreso Internacional sobre Teorías del Espacio-Escala en Visión por Computador. Springer, Berlín, Heidelberg, 1997

[Guidotti-2009-10] Guidotti, P Algunas difusiones anisotrópicas, 2009.

[1]