En el procesamiento de imágenes digitales , la suma de las diferencias absolutas ( SAD ) es una medida de la similitud entre los bloques de imágenes . Se calcula tomando la diferencia absoluta entre cada píxel del bloque original y el píxel correspondiente del bloque que se utiliza para la comparación. Estas diferencias se suman para crear una métrica simple de similitud de bloques, la norma L 1 de la imagen de diferencia o la distancia de Manhattan entre dos bloques de imágenes.
La suma de las diferencias absolutas puede usarse para una variedad de propósitos, como el reconocimiento de objetos , la generación de mapas de disparidad para imágenes estéreo y la estimación de movimiento para la compresión de video .
Ejemplo
Este ejemplo usa la suma de diferencias absolutas para identificar qué parte de una imagen de búsqueda es más similar a una imagen de plantilla. En este ejemplo, la imagen de la plantilla tiene un tamaño de 3 por 3 píxeles, mientras que la imagen de búsqueda tiene un tamaño de 3 por 5 píxeles. Cada píxel está representado por un único número entero de 0 a 9.
Imagen de búsqueda de plantilla 2 5 5 2 7 5 8 6 4 0 7 1 7 4 2 7 7 5 9 8 4 6 8 5
Hay exactamente tres ubicaciones únicas dentro de la imagen de búsqueda donde puede caber la plantilla: el lado izquierdo de la imagen, el centro de la imagen y el lado derecho de la imagen. Para calcular los valores de SAD, se utiliza el valor absoluto de la diferencia entre cada par de píxeles correspondiente: la diferencia entre 2 y 2 es 0, 4 y 1 es 3, 7 y 8 es 1, y así sucesivamente.
Al calcular los valores de las diferencias absolutas para cada píxel, para las tres posibles ubicaciones de la plantilla, se obtiene lo siguiente:
izquierda centro derecha0 2 0 5 0 3 3 3 13 7 3 3 4 5 0 2 01 1 3 3 1 1 1 3 4
Para cada uno de estos tres parches de imagen, las 9 diferencias absolutas se suman, dando valores de SAD de 20, 25 y 17, respectivamente. A partir de estos valores de SAD, se podría afirmar que el lado derecho de la imagen de búsqueda es el más similar a la imagen de la plantilla, porque tiene la suma más baja de diferencias absolutas en comparación con las otras dos ubicaciones.
Comparación con otras métricas
Reconocimiento de objetos
La suma de las diferencias absolutas proporciona una forma sencilla de automatizar la búsqueda de objetos dentro de una imagen, pero puede no ser confiable debido a los efectos de factores contextuales como cambios en la iluminación, el color, la dirección de visualización, el tamaño o la forma. El SAD puede usarse junto con otros métodos de reconocimiento de objetos, como la detección de bordes , para mejorar la confiabilidad de los resultados.
Compresión de video
SAD es una métrica extremadamente rápida debido a su simplicidad; De hecho, es la métrica más simple posible que tiene en cuenta cada píxel de un bloque. Por lo tanto, es muy eficaz para una búsqueda de movimiento amplia de muchos bloques diferentes. SAD también se puede paralelizar fácilmente ya que analiza cada píxel por separado, lo que lo hace fácilmente implementable con instrucciones como ARM NEON o x86 SSE2 . Por ejemplo, SSE ha empaquetado la instrucción de suma de diferencias absolutas (PSADBW) específicamente para este propósito. Una vez que se encuentran los bloques candidatos, el refinamiento final del proceso de estimación de movimiento a menudo se realiza con otras métricas más lentas pero más precisas, que tienen mejor en cuenta la percepción humana . Estos incluyen la suma de las diferencias transformadas absolutas (SATD), la suma de las diferencias al cuadrado (SSD) y la optimización de la distorsión de la tasa .
Ver también
Referencias
- EG Richardson, Iain (2003). Compresión de video H.264 y MPEG-4: Codificación de video para multimedia de próxima generación . Chichester: John Wiley & Sons Ltd.