En la ciencia de la imagen , la diferencia de gaussianos ( DoG ) es un algoritmo de mejora de características que implica la sustracción de una versión gaussiana borrosa de una imagen original de otra versión menos borrosa del original. En el caso simple de imágenes en escala de grises , las imágenes borrosas se obtienen convolucionando las imágenes originales en escala de grises con núcleos gaussianos que tienen diferente ancho (desviaciones estándar). Desenfocar una imagen con un kernel gaussiano solo suprime el espacio de alta frecuenciainformación. Restar una imagen de la otra conserva la información espacial que se encuentra entre el rango de frecuencias que se conservan en las dos imágenes borrosas. Por lo tanto, el DoG es un filtro de paso de banda espacial que atenúa las frecuencias en la imagen original en escala de grises que están lejos del centro de la banda. [1]
Matemáticas de diferencia de gaussianos
Dada una imagen n-dimensional de canal m
La diferencia de gaussianos (DoG) de la imagen. es la funcion
obtenido restando la imagen convolucionado con el gaussiano de varianza de la imagen convolucionado con un gaussiano de varianza más estrecha, con . En una dimensión Se define como:
y para el caso bidimensional centrado:
que es formalmente equivalente a:
que representa una imagen enrevesada a la diferencia de dos gaussianos, que se aproxima a una función del sombrero mexicano .
La relación entre la diferencia del operador gaussiano y el laplaciano del operador gaussiano (la ondícula del sombrero mexicano ) se explica en el apéndice A de Lindeberg (2015). [2]
Detalles y aplicaciones
Como algoritmo de mejora de características , la diferencia de gaussianos se puede utilizar para aumentar la visibilidad de los bordes y otros detalles presentes en una imagen digital. Una amplia variedad de filtros de nitidez de bordes alternativos funcionan mejorando los detalles de alta frecuencia, pero debido a que el ruido aleatorio también tiene una frecuencia espacial alta, muchos de estos filtros de nitidez tienden a mejorar el ruido, que puede ser un artefacto indeseable. La diferencia del algoritmo gaussiano elimina los detalles de alta frecuencia que a menudo incluyen ruido aleatorio, lo que hace que este enfoque sea uno de los más adecuados para procesar imágenes con un alto grado de ruido. Un inconveniente importante de la aplicación del algoritmo es una reducción inherente del contraste general de la imagen producida por la operación. [1]
Cuando se utiliza para mejorar la imagen, la diferencia del algoritmo gaussiano se aplica típicamente cuando la relación de tamaño del kernel (2) al kernel (1) es 4: 1 o 5: 1. En las imágenes de ejemplo a la derecha, los tamaños de los núcleos gaussianos empleados para suavizar la imagen de muestra fueron 10 píxeles y 5 píxeles.
El algoritmo también se puede utilizar para obtener una aproximación del Laplaciano de Gauss cuando la relación entre el tamaño 2 y el tamaño 1 es aproximadamente igual a 1,6. [3] El laplaciano de gaussiano es útil para detectar bordes que aparecen en varias escalas de imagen o grados de enfoque de imagen. Los valores exactos de los tamaños de los dos núcleos que se utilizan para aproximar el Laplaciano de Gauss determinarán la escala de la imagen de diferencia, que puede aparecer borrosa como resultado.
Las diferencias de gaussianos también se han utilizado para la detección de manchas en la transformación de características invariantes de escala . De hecho, la DoG como la diferencia de dos distribuciones normales multivariadas siempre tiene una suma nula total y convolucionarla con una señal uniforme no genera respuesta. Se aproxima bien a un segundo derivado de Gaussiano ( Laplaciano de Gaussiano ) con K ~ 1.6 y los campos receptivos de las células ganglionares en la retina con K ~ 5. Se puede usar fácilmente en esquemas recursivos y se usa como operador en algoritmos en tiempo real para la detección de manchas y la selección automática de escalas.
Más información
En su funcionamiento, se cree que la diferencia del algoritmo de Gauss imita cómo el procesamiento neuronal en la retina del ojo extrae detalles de las imágenes destinadas a la transmisión al cerebro. [4] [5] [6]
Ver también
- Algoritmo de Marr-Hildreth
- Tratamiento de la diferencia de enfoque de Gauss en la detección de manchas.
- Detección de manchas
- Pirámide gaussiana
- Espacio de escala
- Transformación de características invariantes de escala
Referencias
- ^ a b "Manual de microscopía de expresiones moleculares: procesamiento de imágenes digitales - diferencia del algoritmo de mejora de bordes de Gauss", Olympus America Inc. y Universidad Estatal de Florida Michael W. Davidson, Mortimer Abramowitz
- ^ Lindeberg (2015) `` Coincidencia de imágenes usando puntos de interés de espacio de escala generalizados '', Journal of Mathematical Imaging and Vision, volumen 52, número 1, páginas 3-36, 2015.
- ^ D. Marr; E. Hildreth (29 de febrero de 1980). "Teoría de la detección de bordes". Actas de la Royal Society of London. Serie B, Ciencias Biológicas . 207 (1167): 215–217. Código bibliográfico : 1980RSPSB.207..187M . doi : 10.1098 / rspb.1980.0020 . JSTOR 35407 . PMID 6102765 . - Una diferencia de gaussianos de cualquier escala es una aproximación al laplaciano del gaussiano (consulte la entrada para la diferencia de gaussianos en Detección de manchas ). Sin embargo, Marr y Hildreth recomiendan la relación de 1,6 debido a consideraciones de diseño que equilibran el ancho de banda y la sensibilidad. La URL de esta referencia solo puede hacer que la primera página y el resumen del artículo estén disponibles dependiendo de si se está conectando a través de una institución académica o no.
- ^ C. Enroth-Cugell; JG Robson (1966). "La sensibilidad al contraste de las células ganglionares de la retina del gato" . Revista de fisiología . 187 (3): 517–23. doi : 10.1113 / jphysiol.1966.sp008107 . PMC 1395960 . PMID 16783910 .
- ^ Matthew J. McMahon; Orin S. Packer; Dennis M. Dacey (14 de abril de 2004). "El entorno de campo receptivo clásico de las células ganglionares de parasol de primates está mediado principalmente por una vía no GABAérgica" (PDF) . Revista de neurociencia . doi : 10.1523 / JNEUROSCI.5252-03.2004 . PMC 6729348 . PMID 15084653 .
- ^ Joven, Richard (1987). "El modelo derivado de Gauss para la visión espacial: I. Mecanismos de la retina". Visión espacial . 2 (4): 273-293 (21). doi : 10.1163 / 156856887X00222 .
Otras lecturas
- Notas de Bryan S. Morse sobre detección de bordes y matemáticas relacionadas con Gauss de la Universidad de Edimburgo.