Transformada de Hough generalizada


La transformada de Hough generalizada ( GHT ), presentada por Dana H. Ballard en 1981, es la modificación de la transformada de Hough utilizando el principio de coincidencia de plantillas . [1] La transformada de Hough se desarrolló inicialmente para detectar formas definidas analíticamente (p. ej., línea , círculo , elipse , etc.). En estos casos, tenemos conocimiento de la forma y pretendemos averiguar su ubicación y orientación en la imagen. Esta modificación permite utilizar la transformada de Hough para detectar un objeto arbitrario descrito con su modelo.

El problema de encontrar el objeto (descrito con un modelo) en una imagen puede resolverse encontrando la posición del modelo en la imagen. Con la transformada de Hough generalizada, el problema de encontrar la posición del modelo se transforma en un problema de encontrar el parámetro de transformación que mapea el modelo en la imagen. Dado el valor del parámetro de la transformación, se puede determinar la posición del modelo en la imagen.

La implementación original de GHT usaba información de borde para definir un mapeo desde la orientación de un punto de borde hasta un punto de referencia de la forma. En el caso de una imagen binaria donde los píxeles pueden ser negros o blancos, cada píxel negro de la imagen puede ser un píxel negro del patrón deseado, creando así un lugar geométrico de puntos de referencia en el espacio de Hough. Cada píxel de la imagen vota por sus correspondientes puntos de referencia. Los puntos máximos del espacio de Hough indican posibles puntos de referencia del patrón en la imagen. Este máximo se puede encontrar escaneando el espacio de Hough o resolviendo un conjunto relajado de ecuaciones , cada una de las cuales corresponde a un píxel negro. [2]

Merlin y Farber [3] mostraron cómo utilizar un algoritmo de Hough cuando las curvas deseadas no podían describirse analíticamente. Fue un precursor del algoritmo de Ballard que estaba restringido a la traducción y no tenía en cuenta los cambios de escala y rotación . [4]

El algoritmo Merlin-Farber no es práctico para datos de imágenes reales, ya que en una imagen con muchos píxeles en los bordes, encuentra muchos falsos positivos debido a la disposición repetitiva de píxeles.

Para generalizar el algoritmo de Hough a curvas no analíticas, Ballard define los siguientes parámetros para una forma generalizada: a={y,s,θ} donde y es un origen de referencia para la forma, θ es su orientación y s = (s x , s y ) describe dos factores de escala ortogonales . Un algoritmo puede calcular el mejor conjunto de parámetros para una forma determinada a partir de datos de píxeles de borde. Estos parámetros no tienen el mismo estatus. La ubicación del origen de referencia, y , se describe en términos de una tabla de plantilla denominada tabla R de posibles orientaciones de píxeles de borde. El cálculo de los parámetros adicionales s y Entonces, θ se logra mediante transformaciones directas a esta tabla. La generalización clave para formas arbitrarias es el uso de información direccional. Dada cualquier forma y un punto de referencia fijo en ella, en lugar de una curva paramétrica, la información proporcionada por los píxeles de contorno se almacena en forma de tabla R en la etapa de transformación. Para cada punto de borde en la imagen de prueba, las propiedades del punto se buscan en la tabla R y se recupera el punto de referencia y se incrementa la celda apropiada en una matriz llamada matriz acumuladora. La celda con el máximo de 'votos' en la matriz del Acumulador puede ser un posible punto de existencia de referencia fija del objeto en la imagen de prueba.


Geometría de detección de forma para transformada de Hough generalizada