La detección de peatones es una tarea esencial y significativa en cualquier sistema de videovigilancia inteligente , ya que proporciona la información fundamental para la comprensión semántica de las secuencias de video . Tiene una extensión obvia a las aplicaciones automotrices debido al potencial para mejorar los sistemas de seguridad. Muchos fabricantes de automóviles (por ejemplo, Volvo, Ford, GM, Nissan) ofrecen esto como una opción ADAS en 2017.
Desafíos
- Varios estilos de ropa en apariencia.
- Diferentes articulaciones posibles
- La presencia de accesorios ocluyentes.
- Oclusión frecuente entre peatones.
Enfoques existentes
A pesar de los desafíos, la detección de peatones sigue siendo un área de investigación activa en visión por computadora en los últimos años. Se han propuesto numerosos enfoques.
Detección holística
Los detectores están entrenados para buscar peatones en el cuadro de video escaneando todo el cuadro. El detector "dispararía" si las características de la imagen dentro de la ventana de búsqueda local cumplen con ciertos criterios. Algunos métodos emplean características globales como plantilla de borde, [1] otros usan características locales como histograma de gradientes orientados [2] descriptores. El inconveniente de este enfoque es que el rendimiento puede verse afectado fácilmente por el desorden y las oclusiones del fondo.
Detección basada en piezas
Los peatones se modelan como conjuntos de piezas. Las hipótesis de las partes se generan en primer lugar mediante el aprendizaje de características locales, que incluyen características de orientación y de borde [3] . [4] Estas hipótesis parciales se unen luego para formar el mejor conjunto de hipótesis peatonales existentes. Aunque este enfoque es atractivo, la detección de piezas en sí misma es una tarea difícil. La implementación de este enfoque sigue un procedimiento estándar para procesar los datos de la imagen que consiste en crear primero una pirámide de imágenes densamente muestreadas, calcular las características en cada escala, realizar la clasificación en todas las ubicaciones posibles y, finalmente, realizar la supresión no máxima para generar el conjunto final de cuadros delimitadores. [5]
Detección basada en parches
En 2005, Leibe et al. [6] propuso un enfoque que combina la detección y la segmentación con el nombre Modelo de forma implícita (ISM). Se aprende un libro de códigos de apariencia local durante el proceso de capacitación. En el proceso de detección, las características locales extraídas se utilizan para hacer coincidir las entradas del libro de códigos, y cada coincidencia arroja un voto para las hipótesis de los peatones. Los resultados finales de la detección se pueden obtener refinando aún más esas hipótesis. La ventaja de este enfoque es que solo se requiere una pequeña cantidad de imágenes de entrenamiento.
Detección basada en movimiento
Cuando las condiciones lo permiten (cámara fija, condiciones de iluminación estacionaria, etc.), la sustracción de fondo puede ayudar a detectar peatones. La sustracción de fondo clasifica los píxeles de las transmisiones de video como fondo, donde no se detecta movimiento, o primer plano, donde se detecta movimiento. Este procedimiento resalta las siluetas (los componentes conectados en primer plano) de cada elemento en movimiento en la escena, incluidas las personas. Se ha desarrollado un algoritmo, [7] [8] en la Universidad de Lieja , para analizar la forma de estas siluetas con el fin de detectar a los humanos. Dado que los métodos que consideran la silueta como un todo y realizan una clasificación única son, en general, muy sensibles a los defectos de forma, se ha propuesto un método basado en partes que divide las siluetas en un conjunto de regiones más pequeñas para disminuir la influencia de los defectos. Al contrario de otros enfoques basados en piezas, estas regiones no tienen ningún significado anatómico. Este algoritmo se ha extendido a la detección de humanos en transmisiones de video 3D. [9]
Detección usando múltiples cámaras
Fleuret y col. [10] sugirió un método para integrar múltiples cámaras calibradas para detectar múltiples peatones. En este enfoque, el plano del suelo se divide en celdas de cuadrícula uniformes que no se superponen, generalmente con un tamaño de 25 por 25 (cm). El detector produce un mapa de probabilidad de ocupación (POM), proporciona una estimación de la probabilidad de que cada celda de la cuadrícula sea ocupada por una persona. Dadas dos o cuatro secuencias de video sincronizadas tomadas al nivel de los ojos y desde diferentes ángulos, este método puede combinar de manera efectiva un modelo generativo con programación dinámica para seguir con precisión hasta seis personas en miles de cuadros a pesar de oclusiones significativas y cambios de iluminación. También puede derivar trayectorias métricamente precisas para cada uno de ellos.
Trabajo seminal relacionado
Ver también
Referencias
- ^ C. Papageorgiou y T. Poggio, "Un sistema de detección de peatones entrenables", International Journal of Computer Vision (IJCV), páginas 1: 15–33, 2000
- ^ N. Dalal, B. Triggs, "Histogramas de gradientes orientados para la detección humana", IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR), páginas 1: 886–893, 2005
- ^ Bo Wu y Ram Nevatia, "Detección de múltiples seres humanos parcialmente ocluidos en una sola imagen mediante la combinación bayesiana de detectores de piezas de borde", Conferencia internacional IEEE sobre visión por computadora (ICCV), páginas 1: 90–97, 2005
- ^ Mikolajczyk, K. y Schmid, C. y Zisserman, A. "Detección humana basada en un ensamblaje probabilístico de detectores de piezas robustas", The European Conference on Computer Vision (ECCV), volumen 3021/2004, páginas 69–82, 2005
- ^ Hyunggi Cho, Paul E. Rybski, Aharon Bar-Hillel y Wende Zhang "Detección de peatones en tiempo real con modelos de piezas deformables"
- ^ B.Leibe, E. Seemann y B. Schiele. "Detección de peatones en escenas concurridas" Conferencia IEEE sobre visión por computadora y reconocimiento de patrones (CVPR), páginas 1: 878–885, 2005
- ^ O. Barnich, S. Jodogne y M. Van Droogenbroeck. "Análisis robusto de siluetas por distribuciones de tamaño morfológico" Conceptos avanzados para sistemas de visión inteligente (ACIVS), páginas 734–745, 2006
- ^ S. Piérard, A. Lejeune y M. Van Droogenbroeck. "Un enfoque basado en píxeles probabilísticos para detectar seres humanos en secuencias de vídeo" Conferencia internacional IEEE sobre acústica, procesamiento de voz y señales (ICASSP), páginas 921–924, 2011
- ^ S. Piérard, A. Lejeune y M. Van Droogenbroeck. "La información 3D es valiosa para la detección de seres humanos en secuencias de vídeo" Actas de 3D Stereo MEDIA , páginas 1 a 4, 2010
- ^ F. Fleuret, J. Berclaz, R. Lengagne y P. Fua, Seguimiento de personas multicámara con un mapa de ocupación probabilístico, Transacciones IEEE sobre análisis de patrones e inteligencia de máquinas, vol. 30, Nr. 2, págs. 267-282, febrero de 2008.
enlaces externos
- Código para POM : detección de peatones de varias cámaras utilizando un mapa de ocupación probabilístico
- Sistema de detección de peatones para equipo pesado - Ejemplo de sistema de detección de peatones
- Sistema de detección de peatones Blaxtair para planta móvil