La detección de crestas es el intento, mediante software, de localizar crestas (o bordes) en una imagen.
En matemáticas y visión por computadora , las crestas (o el conjunto de crestas ) de una función suave de dos variables son un conjunto de curvas cuyos puntos son, en una o más formas para precisar más abajo, los máximos locales de la función en al menos una dimensión. Esta noción captura la intuición de las cordilleras geográficas . Para una función de N variables, sus crestas son un conjunto de curvas cuyos puntos son máximos locales en N - 1 dimensiones. A este respecto, la noción de puntos de cresta amplía el concepto de máximo local . En consecuencia, la noción de vallespara una función se puede definir reemplazando la condición de un máximo local con la condición de un mínimo local . La unión de conjuntos de crestas y conjuntos de valles, junto con un conjunto relacionado de puntos llamado conjunto conector forman un conjunto conectado de curvas que se dividen, intersecan o se encuentran en los puntos críticos de la función. Esta unión de conjuntos se denomina conjunto crítico relativo de la función . [1] [2]
Los conjuntos de crestas, los conjuntos de valles y los conjuntos críticos relativos representan información geométrica importante intrínseca a una función. En cierto modo, proporcionan una representación compacta de características importantes de la función, pero la medida en que se pueden utilizar para determinar características globales de la función es una cuestión abierta. La motivación principal para la creación de procedimientos de detección de crestas y valles proviene del análisis de imágenes y la visión por computadora y es capturar el interior de objetos alargados en el dominio de la imagen. Las representaciones relacionadas con las crestas en términos de cuencas hidrográficas se han utilizado para la segmentación de imágenes . También ha habido intentos de capturar las formas de los objetos mediante representaciones basadas en gráficos que reflejan crestas, valles y puntos críticos en el dominio de la imagen. Sin embargo, estas representaciones pueden ser muy sensibles al ruido si se calculan a una única escala. Debido a que los cálculos teóricos del espacio de escala implican una convolución con el núcleo de Gauss (suavizado), se esperaba que el uso de crestas, valles y puntos críticos de múltiples escalas en el contexto de la teoría del espacio de escala debería permitir una representación más robusta de los objetos (o formas) en la imagen.
En este sentido, las cordilleras y los valles pueden verse como un complemento de los puntos de interés natural o los puntos extremos locales. Con conceptos adecuadamente definidos, crestas y valles en el paisaje intensidad (o en alguna otra representación derivada del paisaje intensidad) pueden formar un invariante escala esqueleto para la organización de las limitaciones espaciales en apariencia local, con una serie de similitudes cualitativas a la forma del Blum medial La transformación de eje proporciona un esqueleto de forma para imágenes binarias . En aplicaciones típicas, los descriptores de crestas y valles se utilizan a menudo para detectar carreteras en imágenes aéreas y para detectar vasos sanguíneos en imágenes retinianas o imágenes de resonancia magnética tridimensional .
Definición geométrica diferencial de crestas y valles a una escala fija en una imagen bidimensional
Dejar denotar una función bidimensional, y sea ser la representación en el espacio de escala de obtenido convolviendo con una función gaussiana
- .
Además, deja y denotar los valores propios de la matriz de Hesse
de la representación del espacio-escala con una transformación de coordenadas (una rotación) aplicada a los operadores derivados direccionales locales,
donde pyq son coordenadas del sistema de coordenadas rotado.
Se puede demostrar que la derivada mixta en el sistema de coordenadas transformado es cero si elegimos
- , .
Luego, una definición geométrica diferencial formal de las crestas de a escala fija se puede expresar como el conjunto de puntos que satisfacen [3]
En consecuencia, los valles de a escala son el conjunto de puntos
En términos de sistema de coordenadas con el dirección paralela al degradado de la imagen
dónde
se puede demostrar que esta definición de cresta y valle se puede escribir de manera equivalente [4] como
dónde
y el signo de determina la polaridad; para crestas y por los valles.
Cálculo de crestas de escala variable a partir de imágenes bidimensionales.
Un problema principal con la definición de cresta de escala fija presentada anteriormente es que puede ser muy sensible a la elección del nivel de escala. Los experimentos muestran que el parámetro de escala del núcleo de suavizado previo de Gauss debe ajustarse cuidadosamente al ancho de la estructura de la cresta en el dominio de la imagen, para que el detector de crestas produzca una curva conectada que refleje las estructuras de la imagen subyacente. Para manejar este problema en ausencia de información previa, se ha introducido la noción de crestas de espacio de escala , que trata el parámetro de escala como una propiedad inherente de la definición de cresta y permite que los niveles de escala varíen a lo largo de una cresta de espacio de escala. Además, el concepto de una cresta en el espacio de escala también permite que el parámetro de escala se sintonice automáticamente con el ancho de las estructuras de la cresta en el dominio de la imagen, de hecho como consecuencia de una definición bien establecida. En la literatura, se han propuesto varios enfoques diferentes basados en esta idea.
Dejar denotar una medida de la resistencia de la cresta (que se especificará a continuación). Entonces, para una imagen bidimensional, una cresta del espacio de escala es el conjunto de puntos que satisfacen
dónde es el parámetro de escala en la representación del espacio de escala . De manera similar, un valle de espacio de escala es el conjunto de puntos que satisfacen
Una consecuencia inmediata de esta definición es que para una imagen bidimensional, el concepto de crestas del espacio de escala barre un conjunto de curvas unidimensionales en el espacio de escala tridimensional, donde se permite que el parámetro de escala varíe a lo largo de la escala. -canto del espacio (o el valle del espacio-escala). El descriptor de la cresta en el dominio de la imagen será una proyección de esta curva tridimensional en el plano de la imagen bidimensional, donde la información de la escala de atributos en cada punto de la cresta se puede utilizar como una estimación natural del ancho de la estructura de la cresta en el dominio de la imagen en una vecindad de ese punto.
En la literatura, se han propuesto varias medidas de resistencia de las crestas. Cuando Lindeberg (1996, 1998) [5] acuñó el término cresta en el espacio de la escala, consideró tres medidas de resistencia de la cresta:
- La principal curvatura principal
- expresado en términos de -derivadas normalizadas con
- .
- La plaza de la -diferencia de valor propio cuadrada normalizada
- La plaza de la -diferencia de valor propio normalizada
La noción de -Las derivadas normalizadas son esenciales aquí, ya que permiten calibrar correctamente los algoritmos del detector de crestas y valles. Al requerir que para una cresta gaussiana unidimensional incrustada en dos (o tres dimensiones), la escala de detección debe ser igual al ancho de la estructura de la cresta cuando se mide en unidades de longitud (un requisito de una coincidencia entre el tamaño del filtro de detección y la estructura de la imagen a la que responde), se deduce que uno debe elegir. De estas tres medidas de resistencia de la cresta, la primera entidades una medida de resistencia de crestas de uso general con muchas aplicaciones, como la detección de vasos sanguíneos y la extracción de carreteras. Sin embargo, la entidadse ha utilizado en aplicaciones tales como mejora de huellas dactilares, [6] rastreo de manos en tiempo real y reconocimiento de gestos [7] , así como para modelar estadísticas de imágenes locales para detectar y rastrear humanos en imágenes y video. [8]
También hay otras definiciones de crestas estrechamente relacionadas que hacen uso de derivadas normalizadas con la suposición implícita de . [9] Desarrolle estos enfoques con más detalle. Al detectar crestas con, sin embargo, la escala de detección será dos veces mayor que para , lo que da como resultado más distorsiones de forma y una menor capacidad para capturar crestas y valles con estructuras de imágenes cercanas que interfieren en el dominio de la imagen.
Historia
La noción de crestas y valles en imágenes digitales fue introducida por Haralick en 1983 [10] y por Crowley con respecto a la diferencia de pirámides de Gauss en 1984. [11] [12] La aplicación de descriptores de crestas al análisis de imágenes médicas ha sido ampliamente estudiada por Pizer y sus compañeros de trabajo [13] [14] [15] resultando en su noción de M-reps. [16] Lindeberg también ha fomentado la detección de crestas con la introducción de-derivadas normalizadas y crestas del espacio de escala definidas a partir de la maximización local de la curvatura principal principal apropiadamente normalizada de la matriz de Hesse (u otras medidas de resistencia de las crestas) sobre el espacio y la escala. Estas nociones se desarrollaron más tarde con aplicación a la extracción de carreteras por Steger et al. [17] [18] ya la segmentación de vasos sanguíneos por Frangi et al. [19] así como a la detección de estructuras curvilíneas y tubulares por Sato et al. [20] y Krissian et al. [21] Koenderink y van Doorn realizaron una revisión de varias de las definiciones clásicas de crestas a una escala fija, incluidas las relaciones entre ellas. [22] Kirbas y Quek han presentado una revisión de las técnicas de extracción de recipientes. [23]
Definición de crestas y valles en N dimensiones
En su sentido más amplio, la noción de cresta generaliza la idea de un máximo local de una función de valor real. Un punto en el dominio de una función es un máximo local de la función si hay una distancia con la propiedad que si está dentro unidades de , luego . Es bien sabido que los puntos críticos, de los cuales los máximos locales son sólo un tipo, son puntos aislados en el dominio de una función en todas las situaciones excepto en las más inusuales ( es decir , los casos no genéricos).
Considere relajar la condición que por en todo un barrio de un poco para requerir solo que esto se mantenga en un subconjunto dimensional. Es de suponer que esta relajación permite que el conjunto de puntos que satisfacen los criterios, que llamaremos cresta, tenga un solo grado de libertad, al menos en el caso genérico. Esto significa que el conjunto de puntos de cresta formará un lugar unidimensional o una curva de cresta. Observe que lo anterior se puede modificar para generalizar la idea a mínimos locales y dar como resultado lo que podríamos llamar curvas de valle unidimensionales.
La siguiente definición de cresta sigue el libro de Eberly [24] y puede verse como una generalización de algunas de las definiciones de cresta antes mencionadas. Dejar ser un conjunto abierto, y ser suave. Dejar. Dejar ser el gradiente de a , y deja ser el Matriz de Hesse de a . Dejar ser el valores propios ordenados de y deja ser un vector propio unitario en el espacio propio para . (Para esto, se debe asumir que todos los valores propios son distintos).
El punto es un punto en la cresta unidimensional de si se cumplen las siguientes condiciones:
- , y
- por .
Esto hace preciso el concepto de que restringido a este particular -el subespacio dimensional tiene un máximo local en .
Esta definición se generaliza naturalmente a la cresta k- dimensional de la siguiente manera: el puntoes un punto en la cresta k- dimensional de si se cumplen las siguientes condiciones:
- , y
- por .
De muchas formas, estas definiciones generalizan naturalmente la de un máximo local de una función. Damon [1] y Miller establecen las propiedades de las crestas de convexidad máxima sobre una base matemática sólida . [2] Keller estableció sus propiedades en familias de un parámetro. [25]
Cresta de escala máxima
La siguiente definición se remonta a Fritsch [26], quien estaba interesado en extraer información geométrica sobre figuras en imágenes bidimensionales en escala de grises. Fritsch filtró su imagen con un filtro de "medialidad" que le dio información análoga a los datos "distantes al límite" en el espacio de escala. Las crestas de esta imagen, una vez proyectadas sobre la imagen original, debían ser análogas a un esqueleto de forma ( por ejemplo , el eje medial de Blum) de la imagen original.
Lo que sigue es una definición de la cresta de escala máxima de una función de tres variables, una de las cuales es un parámetro de "escala". Una cosa que queremos que sea cierta en esta definición es, sies un punto en esta cresta, entonces el valor de la función en el punto es máximo en la dimensión de la escala. Dejar ser una función diferenciable suave en . La es un punto en la cresta de escala máxima si y solo si
- y , y
- y .
Relaciones entre detección de bordes y detección de crestas
El propósito de la detección de bordes es generalmente capturar el eje principal de simetría de un objeto alargado, [ cita requerida ] mientras que el propósito de la detección de bordes es generalmente capturar el límite del objeto. Sin embargo, alguna literatura sobre detección de bordes erróneamente [ cita requerida ] incluye la noción de crestas en el concepto de bordes, lo que confunde la situación.
En términos de definiciones, existe una estrecha conexión entre los detectores de bordes y los detectores de crestas. Con la formulación de no máximo dada por Canny, [27] sostiene que los bordes se definen como los puntos donde la magnitud del gradiente asume un máximo local en la dirección del gradiente. Siguiendo una forma geométrica diferencial de expresar esta definición, [28] podemos en el mencionadoEl sistema de coordenadas establece que la magnitud del gradiente de la representación del espacio de escala, que es igual a la derivada direccional de primer orden en el -dirección , debe tener su derivada direccional de primer orden en el -dirección igual a cero
mientras que la derivada direccional de segundo orden en el -dirección de debe ser negativo, es decir,
- .
Escrito como una expresión explícita en términos de derivadas parciales locales , ... , esta definición de borde se puede expresar como las curvas de cruce por cero de la invariante diferencial
que satisfacen una condición de signo en el siguiente invariante diferencial
(consulte el artículo sobre detección de bordes para obtener más información). Cabe destacar que los bordes obtenidos de esta manera son las crestas de la magnitud del gradiente.
Ver también
- Espacio de escala
- Detección de características (visión por computadora)
- Detección de bordes
- Detección de puntos de interés
- Detección de manchas
- Visión por computador
Referencias
- ↑ a b Damon, J. (marzo de 1999). "Propiedades de crestas y núcleos en imágenes bidimensionales". J Math Imaging Vis . 10 (2): 163-174. doi : 10.1023 / A: 1008379107611 .
- ^ a b Miller, J. Conjuntos críticos relativos eny aplicaciones al análisis de imágenes. Doctor. Disertación. Universidad de Carolina del Norte. 1998.
- ^ T. Lindeberg (2009). "Espacio de escala" . En Benjamin Wah (ed.). Enciclopedia de Ciencias e Ingeniería de la Computación . IV . John Wiley e hijos. págs. 2495-2504. doi : 10.1002 / 9780470050118.ecse609 . ISBN 978-0470050118.
- ^ Lindeberg, T (1994). "Teoría del espacio-escala: una herramienta básica para analizar estructuras a diferentes escalas" . Revista de estadísticas aplicadas . 21 (2): 224–270. doi : 10.1080 / 757582976 .
- ^ Lindeberg, T. (1998). "Detección de bordes y detección de crestas con selección automática de escala" . Revista Internacional de Visión por Computador . 30 (2): 117-154. doi : 10.1023 / A: 1008097225773 . Versión anterior presentada en IEEE Conference on Pattern Recognition and Computer Vision, CVPR'96, San Francisco, California, páginas 465–470, junio de 1996
- ^ Almansa, A., Lindeberg, T. (2000). "Mejora de huellas dactilares por adaptación de forma de operadores de espacio de escala con selección automática de escala" . Transacciones IEEE sobre procesamiento de imágenes . 9 (12): 2027–42. Código Bibliográfico : 2000ITIP .... 9.2027L . doi : 10.1109 / 83.887971 . PMID 18262941 .CS1 maint: varios nombres: lista de autores ( enlace )
- ^ L. Bretzner, I. Laptev y T. Lindeberg: Reconocimiento de gestos con las manos utilizando características de color de múltiples escalas, modelos jerárquicos y filtrado de partículas, Proc. Conferencia IEEE sobre Rostros y Gestos 2002, Washington DC, 423–428.
- ^ Sidenbladh, H., Black, M. (2003). "Aprendiendo las estadísticas de las personas en imágenes y video" (PDF) . Revista Internacional de Visión por Computador . 54 (1–2): 183–209. doi : 10.1023 / a: 1023765619733 .CS1 maint: varios nombres: lista de autores ( enlace )
- ^ J. Furst y J. Miller, " La cresta de escala máxima: incorporar escala en la definición de cresta ", teoría del espacio de escala en visión por computadora: actas de la primera conferencia internacional sobre el espacio de escala '97, págs. 93-104. Springer Lecture Notes in Computer Science, vol. 1682.
- ^ Haralick, R. (abril de 1983). "Crestas y valles en imágenes digitales". Visión por computadora, gráficos y procesamiento de imágenes . 22 (10): 28–38. doi : 10.1016 / 0734-189X (83) 90094-4 .
- ^ Crowley, JL, Parker, AC (marzo de 1984). "Una representación de la forma basada en picos y crestas en la diferencia de la transformada de paso bajo" (PDF) . IEEE Trans Pattern Anal Mach Intell . 6 (2): 156-170. CiteSeerX 10.1.1.161.3102 . doi : 10.1109 / TPAMI.1984.4767500 . PMID 21869180 .CS1 maint: varios nombres: lista de autores ( enlace )
- ^ Crowley, JL, Sanderson, A. (enero de 1987). "Representación de resolución múltiple y coincidencia probabilística de forma de escala de grises 2-D" (PDF) . IEEE Trans Pattern Anal Mach Intell . 9 (1): 113–121. CiteSeerX 10.1.1.1015.9294 . doi : 10.1109 / TPAMI.1987.4767876 . PMID 21869381 .CS1 maint: varios nombres: lista de autores ( enlace )
- ^ Gauch, JM, Pizer, SM (junio de 1993). "Análisis multirresolución de crestas y valles en imágenes en escala de grises". IEEE Trans Pattern Anal Mach Intell . 15 (6): 635–646. doi : 10.1109 / 34.216734 .CS1 maint: varios nombres: lista de autores ( enlace )
- ^ Eberly D .; Gardner R .; Morse B .; Pizer S .; Scharlach C. (diciembre de 1994). "Crestas para análisis de imágenes". Revista de Visión y Imágenes Matemáticas . 4 (4): 353–373. doi : 10.1007 / BF01262402 .
- ^ Pizer, Stephen M., Eberly, David, Fritsch, Daniel S. (enero de 1998). "Visión invariante de zoom de forma figurativa: la matemática de los núcleos". Visión por Computador y Interpretación de Imágenes . 69 (1): 55–71. CiteSeerX 10.1.1.38.3116 . doi : 10.1006 / cviu.1997.0563 .CS1 maint: varios nombres: lista de autores ( enlace )
- ^ S. Pizer, S. Joshi, T. Fletcher, M. Styner, G. Tracton, J. Chen (2001) "Segmentación de objetos de una sola figura por representantes M deformables", Actas de la 4ta Conferencia Internacional sobre Imagen Médica Computación e intervención asistida por computadora, Notas de la conferencia de Springer en Ciencias de la Computación; Vol. 2208, págs. 862–871
- ^ Steger C. (1998). "Un detector imparcial de estructuras curvilíneas". IEEE Trans Pattern Anal Mach Intell . 20 (2): 113–125. CiteSeerX 10.1.1.42.2266 . doi : 10.1109 / 34.659930 .
- ^ Laptev I .; Mayer H .; Lindeberg T .; Eckstein W .; Steger C .; Baumgartner A. (2000). "Extracción automática de carreteras a partir de imágenes aéreas basadas en escamas-espacio y serpientes" (PDF) . Visión artificial y aplicaciones . 12 (1): 23–31. doi : 10.1007 / s001380050121 .
- ^ Frangi AF, Niessen WJ, Hoogeveen RM, van Walsum T, Viergever MA (octubre de 1999). "Cuantificación basada en modelos de imágenes angiográficas de resonancia magnética 3-D". IEEE Trans Med Imaging . 18 (10): 946–56. CiteSeerX 10.1.1.502.5994 . doi : 10.1109 / 42.811279 . PMID 10628954 .
- ^ Sato Y, Nakajima S, Shiraga N, Atsumi H, Yoshida S, et al. (1998). "Filtro de línea tridimensional multiescala para segmentación y visualización de estructuras curvilíneas en imágenes médicas" (PDF) . Análisis de imágenes médicas . 2 (2): 143–168. doi : 10.1016 / s1361-8415 (98) 80009-1 . PMID 10646760 .
- ^ Krissian K .; Malandain G .; Ayache N .; Vaillan R .; Trousset Y. (2000). "Detección basada en modelos de estructuras tubulares en imágenes 3D" . Visión por Computador y Interpretación de Imágenes . 80 (2): 130-171. doi : 10.1006 / cviu.2000.0866 .
- ^ Koenderink, Jan J., van Doorn, Andrea J. (mayo de 1994). "Geometría diferencial 2 + 1-D". Cartas de reconocimiento de patrones . 15 (5): 439–443. doi : 10.1016 / 0167-8655 (94) 90134-1 .CS1 maint: varios nombres: lista de autores ( enlace )
- ^ Kirbas C, Quek F (2004). "Una revisión de las técnicas y algoritmos de extracción de vasos" (PDF) . Encuestas de computación ACM . 36 (2): 81-121. CiteSeerX 10.1.1.460.8544 . doi : 10.1145 / 1031120.1031121 .
- ^ Eberly, D. (1996). Crestas en análisis de imágenes y datos . Kluwer. ISBN 978-0-7923-4268-7.
- ^ Kerrel, R. Transiciones genéricas de conjuntos críticos relativos en familias parametrizadas con aplicaciones al análisis de imágenes . Universidad de Carolina del Norte. 1999.
- ^ Fritsch, DS, Eberly, D., Pizer, SM y McAuliffe, MJ. "Núcleos estimulados y sus aplicaciones en imágenes médicas". Procesamiento de información en imágenes médicas, Y. Bizais, C Barillot, R DiPaola, eds., Serie Kluwer en imágenes computacionales y visión, págs. 365–368.
- ^ Canny J. (1986). "Un enfoque computacional para la detección de bordes" . IEEE Trans Pattern Anal Mach Intell . 8 (6): 679–698. doi : 10.1109 / TPAMI.1986.4767851 . PMID 21869365 .
- ^ Lindeberg T. (1993). "Aproximaciones derivadas discretas con propiedades de espacio de escala: una base para la extracción de características de bajo nivel" . Revista de Visión y Imágenes Matemáticas . 3 (4): 349–376. doi : 10.1007 / BF01664794 .