Las características similares a las de Haar son características de imágenes digitales que se utilizan en el reconocimiento de objetos . Deben su nombre a su similitud intuitiva con las ondas de Haar y se utilizaron en el primer detector facial en tiempo real. [1]
Históricamente, trabajar solo con intensidades de imagen (es decir, los valores de píxeles RGB en todos y cada uno de los píxeles de la imagen) hacía que la tarea del cálculo de características fuera computacionalmente costosa . Una publicación de Papageorgiou et al. [2] discutió trabajar con un conjunto de características alternativas basadas en ondas de Haar en lugar de las intensidades de imagen habituales. Paul Viola y Michael Jones [1] adaptaron la idea de usar ondas de Haar y desarrollaron las llamadas características similares a Haar. Una característica similar a Haar considera regiones rectangulares adyacentes en una ubicación específica en una ventana de detección, suma las intensidades de píxeles en cada región y calcula la diferencia entre estas sumas. Esta diferencia se usa luego paracategorizar subsecciones de una imagen. Por ejemplo, con un rostro humano, es una observación común que entre todos los rostros la región de los ojos es más oscura que la región de las mejillas. Por lo tanto, una característica común de Haar para la detección de rostros es un conjunto de dos rectángulos adyacentes que se encuentran sobre el ojo y la región de las mejillas. La posición de estos rectángulos se define en relación con una ventana de detección que actúa como un cuadro delimitador del objeto de destino (la cara en este caso).
En la fase de detección del marco de detección de objetos Viola-Jones , una ventana del tamaño del objetivo se mueve sobre la imagen de entrada y para cada subsección de la imagen se calcula la característica similar a Haar. Luego, esta diferencia se compara con un umbral aprendido que separa los no objetos de los objetos. Debido a que una característica similar a Haar es solo un aprendiz o clasificador débil (su calidad de detección es ligeramente mejor que la adivinación aleatoria), se necesita una gran cantidad de características similares a Haar para describir un objeto con suficiente precisión. En el marco de detección de objetos de Viola-Jones, las características similares a Haar se organizan, por lo tanto, en algo llamado cascada de clasificadores para formar un aprendiz o clasificador fuerte.
La ventaja clave de una función similar a Haar sobre la mayoría de las otras funciones es su velocidad de cálculo. Debido al uso de imágenes integrales , una característica similar a Haar de cualquier tamaño se puede calcular en tiempo constante (aproximadamente 60 instrucciones de microprocesador para una característica de 2 rectángulos).
Características rectangulares similares a Haar
Una característica simple rectangular similar a Haar se puede definir como la diferencia de la suma de píxeles de las áreas dentro del rectángulo, que pueden estar en cualquier posición y escala dentro de la imagen original. Este conjunto de características modificado se denomina característica de 2 rectángulos . Viola y Jones también definieron características de 3 rectángulos y características de 4 rectángulos. Los valores indican ciertas características de un área particular de la imagen. Cada tipo de característica puede indicar la existencia (o ausencia) de ciertas características en la imagen, como bordes o cambios en la textura. Por ejemplo, una característica de 2 rectángulos puede indicar dónde se encuentra el borde entre una región oscura y una región clara.
Cálculo rápido de características similares a Haar
Una de las contribuciones de Viola y Jones fue el uso de tablas de áreas sumadas , [3] a las que llamaron imágenes integrales . Las imágenes integrales se pueden definir como tablas de búsqueda bidimensionales en forma de matriz con el mismo tamaño de la imagen original. Cada elemento de la imagen integral contiene la suma de todos los píxeles ubicados en la región superior izquierda de la imagen original (en relación con la posición del elemento). Esto permite calcular la suma de áreas rectangulares en la imagen, en cualquier posición o escala, usando solo cuatro búsquedas:
![](http://wikiimg.tojsiabtv.com/wikipedia/commons/thumb/e/ee/Prm_VJ_fig3_computeRectangleWithAlpha.png/220px-Prm_VJ_fig3_computeRectangleWithAlpha.png)
donde apunta pertenecen a la imagen integral , como se muestra en la figura.
Cada característica similar a Haar puede necesitar más de cuatro búsquedas, dependiendo de cómo se haya definido. Las funciones de 2 rectángulos de Viola y Jones necesitan seis búsquedas, las de 3 rectángulos necesitan ocho búsquedas y las de 4 rectángulos necesitan nueve búsquedas.
Características similares a las de Haar inclinadas
Lienhart y Maydt [4] introdujeron el concepto de una característica similar a Haar inclinada (45 °). Esto se utilizó para aumentar la dimensionalidad del conjunto de características en un intento de mejorar la detección de objetos en imágenes. Esto tuvo éxito, ya que algunas de estas características pueden describir el objeto de una mejor manera. Por ejemplo, una característica similar a Haar inclinada de 2 rectángulos puede indicar la existencia de un borde a 45 °.
Messom y Barczak [5] ampliaron la idea a una característica genérica rotada similar a Haar. Aunque la idea es sólida matemáticamente, los problemas prácticos impiden el uso de funciones similares a las de Haar en cualquier ángulo. Para ser rápidos, los algoritmos de detección utilizan imágenes de baja resolución que introducen errores de redondeo . Por esta razón, las características similares a Haar rotadas no se utilizan comúnmente.
Referencias
- ^ a b Viola y Jones, " Detección rápida de objetos mediante una cascada potenciada de funciones simples ", Visión por computadora y reconocimiento de patrones , 2001
- ^ Papageorgiou, Oren y Poggio, "Un marco general para la detección de objetos", Conferencia internacional sobre visión por computadora, 1998.
- ^ Crow, F, " Tablas de área sumada para mapeo de texturas ", en Proceedings of SIGGRAPH , 18 (3): 207-212, 1984
- ^ Lienhart, R. y Maydt, J., " Un conjunto extendido de características similares a Haar para la detección rápida de objetos ", ICIP02, págs. I: 900–903, 2002
- ^ Messom, CH y Barczak, ALC, " Funciones similares a las de Haar rotado rápidas y eficientes mediante imágenes integrales giradas ", Conferencia australiana sobre robótica y automatización (ACRA2006), págs. 1-6, 2006
- Haar A. Zur Theorie der orthogonalen Funktionensysteme , Mathematische Annalen, 69 , págs. 331–371, 1910.