El análisis de contenido de video o análisis de contenido de video ( VCA ), también conocido como análisis de video o análisis de video ( VA ), es la capacidad de analizar automáticamente el video para detectar y determinar eventos temporales y espaciales.
Esta capacidad técnica se utiliza en una amplia gama de dominios que incluyen entretenimiento, [1] recuperación de video y navegación de video , [2] cuidado de la salud, comercio minorista, automotriz, transporte, domótica , detección de llamas y humo, seguridad y protección. [3] Los algoritmos se pueden implementar como software en máquinas de uso general o como hardware en unidades de procesamiento de video especializadas.
Se pueden implementar muchas funcionalidades diferentes en VCA. La detección de movimiento por video es una de las formas más simples en las que se detecta movimiento con respecto a una escena de fondo fija. Las funcionalidades más avanzadas incluyen seguimiento de video [4] y estimación de movimiento . [5]
A partir de la representación interna que VCA genera en la máquina, es posible construir otras funcionalidades, como resumen de video , [6] identificación , análisis de comportamiento u otras formas de conocimiento de la situación .
AVC se basa en un buen vídeo de entrada, por lo que a menudo se combina con las tecnologías de mejora de vídeo, tales como eliminación de ruido de vídeo , estabilización de imagen , máscara de enfoque , y de super-resolución .
Funcionalidades
Varios artículos proporcionan una descripción general de los módulos involucrados en el desarrollo de aplicaciones analíticas de video. [7] [8] Esta es una lista de funcionalidades conocidas y una breve descripción.
Función | Descripción |
---|---|
Enmascaramiento dinámico | Bloquear una parte de la señal de vídeo en función de la propia señal, por ejemplo, por motivos de privacidad. |
Detección de llamas y humo | Las cámaras IP con tecnología de videovigilancia inteligente se pueden utilizar para detectar llamas y humo en 15 a 20 segundos o incluso menos gracias al chip DSP integrado . El chip procesa algoritmos que analizan los videos capturados en busca de características de llama y humo, como crominancia de color, relación de parpadeo, forma, patrón y dirección de movimiento. |
Estimación de egomoción | La estimación de movimiento se utiliza para determinar la ubicación de una cámara analizando su señal de salida. |
Detección de movimiento | La detección de movimiento se utiliza para determinar la presencia de movimiento relevante en la escena observada. |
Reconocimiento de formas | El reconocimiento de formas se utiliza para reconocer formas en el vídeo de entrada, por ejemplo, círculos o cuadrados. Esta funcionalidad se utiliza normalmente en funcionalidades más avanzadas, como la detección de objetos. |
Detección de objetos | La detección de objetos se utiliza para determinar la presencia de un tipo de objeto o entidad, por ejemplo, una persona o un automóvil. Otros ejemplos incluyen detección de fuego y humo. |
Reconocimiento | El reconocimiento facial y el reconocimiento automático de matrículas se utilizan para reconocer y, por lo tanto, posiblemente identificar a personas o automóviles. |
Detección de estilo | La detección de estilo se utiliza en entornos en los que se ha producido la señal de vídeo , por ejemplo, para una emisión de televisión. La detección de estilo detecta el estilo del proceso de producción. [9] |
Detección de sabotaje | La detección de manipulación se utiliza para determinar si la cámara o la señal de salida están manipuladas. |
Seguimiento de video | El seguimiento de video se utiliza para determinar la ubicación de personas u objetos en la señal de video, posiblemente con respecto a una cuadrícula de referencia externa. |
Análisis del nivel de error de video | Análisis de manipulación de contenido de escenas de vídeo mediante software gratuito. Análisis de nivel de error de video (VELA) |
Co-segmentación de objetos | Descubrimiento conjunto de objetos, clasificación y segmentación de objetivos en una o varias secuencias de video relacionadas |
Aplicaciones comerciales
VCA es una tecnología relativamente nueva, y numerosas empresas lanzaron productos mejorados con VCA a mediados de la década de 2000. [10] [11] [12] Si bien hay muchas aplicaciones, el historial de diferentes soluciones de VCA difiere ampliamente. Funcionalidades como la detección de movimiento , el conteo de personas y la detección de armas están disponibles como productos comerciales listos para usar y se cree que tienen un historial decente (por ejemplo, incluso el software gratuito como dsprobotics Flowstone puede manejar el análisis de movimiento y color). En respuesta a la pandemia de COVID-19 , muchos fabricantes de software han introducido nuevos análisis de salud pública como la detección de mascarillas o el seguimiento del distanciamiento social . [13] [14] [15]
En muchos dominios, VCA se implementa en sistemas de CCTV , ya sea distribuidos en las cámaras (en el borde) o centralizados en sistemas de procesamiento dedicados. Video Analytics y Smart CCTV son términos comerciales para VCA en el ámbito de la seguridad. En el Reino Unido, la BSIA ha desarrollado una guía de introducción para VCA en el ámbito de la seguridad. [16] Además del análisis de video y para complementarlo, también se puede utilizar el análisis de audio. [17]
Los fabricantes de software de gestión de vídeo están ampliando constantemente la gama de módulos de análisis de vídeo disponibles. Con la nueva tecnología de rastreo de sospechosos, es posible rastrear fácilmente todos los movimientos de este sujeto: de dónde vinieron y cuándo, dónde y cómo se movieron. Dentro de un sistema de vigilancia particular, la tecnología de indexación puede ubicar a personas con características similares que se encontraban dentro de los puntos de vista de las cámaras durante o dentro de un período de tiempo específico. Por lo general, el sistema encuentra muchas personas diferentes con características similares y las presenta en forma de instantáneas. El operador solo necesita hacer clic en aquellas imágenes y sujetos que necesitan ser rastreados. En aproximadamente un minuto, es posible rastrear todos los movimientos de una persona en particular e incluso crear un video paso a paso de los movimientos.
Kinect es un periférico adicional para la consola de juegos Xbox 360 que usa VCA como parte de la entrada del usuario. [18]
En la industria minorista, el VCA se utiliza para rastrear a los compradores dentro de la tienda. [19] De esta manera, se puede obtener un mapa de calor de la tienda, que es beneficioso para el diseño de la tienda y las optimizaciones de marketing. Otras aplicaciones incluyen el tiempo de permanencia al mirar un producto y la detección de artículo eliminado / dejado.
La calidad del AVC en el entorno comercial es difícil de determinar. Depende de muchas variables, como el caso de uso , la implementación , la configuración del sistema y la plataforma informática . Los métodos típicos para tener una idea objetiva de la calidad en entornos comerciales incluyen evaluaciones comparativas independientes [20] y ubicaciones de prueba designadas.
El VCA se ha utilizado con fines de gestión de multitudes , especialmente en el O2 Arena de Londres y el London Eye .
Cumplimiento de la ley
La policía y los científicos forenses analizan el video de CCTV cuando investigan actividades delictivas. La policía usa software, como Kinesense , que realiza análisis de contenido de video para buscar eventos clave en video y encontrar sospechosos. Las encuestas han demostrado que hasta el 75% de los casos involucran CCTV. La policía usa software de análisis de contenido de video para buscar videos largos de eventos importantes. [21] [22]
Investigación académica
El análisis de contenido de video es un subconjunto de la visión por computadora y, por lo tanto, de la inteligencia artificial . Dos importantes iniciativas académicas de referencia son TRECVID , [23] que utiliza una pequeña parte de las imágenes de vídeo de i-LIDS, y PETS Benchmark Data. [24] Se enfocan en funcionalidades como rastreo, detección de equipaje dejado y cercas virtuales. Los conjuntos de datos de vídeo de referencia, como UCF101 [25], permiten realizar investigaciones de reconocimiento de acciones que incorporan la atención visual temporal y espacial con una red neuronal convolucional y una memoria larga a corto plazo . El software de análisis de video también se está emparejando con imágenes de cámaras corporales y de tablero para redactar más fácilmente las imágenes para su divulgación pública e identificar eventos y personas en los videos. [26]
La UE está financiando un proyecto del 7º PM llamado P-REACT [27] para integrar el análisis de contenido de vídeo en sistemas integrados con bases de datos de seguridad policial y del transporte. [28]
Inteligencia artificial
La inteligencia artificial para la videovigilancia utiliza programas de software que analizan el audio y las imágenes de las cámaras de videovigilancia para reconocer humanos, vehículos, objetos y eventos. El programa de contratistas de seguridad es el software para definir áreas restringidas dentro de la vista de la cámara (como un área cercada, un estacionamiento, pero no la acera o la calle pública fuera del estacionamiento) y el programa para las horas del día (como después del cierre del horario comercial). ) para que la propiedad esté protegida por la cámara de vigilancia . La inteligencia artificial ("IA") envía una alerta si detecta a un intruso que infringe la "regla" establecida de que no se permite a ninguna persona en esa área durante ese momento del día.
Ver también
- Reconocimiento de actividad
- Inteligencia artificial para videovigilancia
- Análisis de video forense
- Co-segmentación de objetos
- Estructura del movimiento
- Navegación de videos
- Análisis de movimiento de video
- Procesamiento de video
Referencias
- ^ KINECT Archivado el 12 de septiembre de 2010 en Wayback Machine , periférico adicional para laconsola Xbox 360
- ^ Dimitrova, Nevenka, et al. " Aplicaciones de análisis y recuperación de contenido de video ". IEEE multimedia 9.3 (2002): 42-55.
- ^ Aumento del uso de VCA en seguridad británica , informe BSIA
- ^ Cavaliere, Danilo, Vincenzo Loia y Sabrina Senatore. " Hacia un patrón de diseño de ontología para el análisis de contenido de video UAV ". Acceso IEEE 7 (2019): 105342-105353.
- ^ "Una descripción similar a la humana de los eventos de la escena para un análisis de contenido de video basado en UAV adecuado" . Sistemas basados en el conocimiento . 178 : 163-175. 2019-08-15. doi : 10.1016 / j.knosys.2019.04.026 . ISSN 0950-7051 .
- ^ Ma, Yu-Fei, et al. " Un modelo de atención al usuario para resúmenes de videos ". Actas de la décima conferencia internacional ACM sobre Multimedia . 2002.
- ^ Nik Gagvani , Introducción a la analítica de video
- ^ Cheng Peng , análisis de video
- ^ Detección de estilo , Cees GM Snoek et al., Detección de monólogos de noticias de televisión por análisis de estilo , ICME'04
- ^ Kwet, Michael (27 de enero de 2020). "El auge de las redes de cámaras inteligentes y por qué deberíamos prohibirlas" . La intercepción . Consultado el 19 de octubre de 2020 .
- ^ "Aimetis" , Wikipedia , 2020-01-28 , consultado 2020-10-19
- ^ "Infografía: Historia de la videovigilancia" . IFSEC Global | Recursos y noticias sobre seguridad y incendios . 2013-12-12 . Consultado el 19 de octubre de 2020 .
- ^ "COVID-19 hace que la detección de máscaras faciales sea esencial en el análisis de video - asmag.com" . www.asmag.com . Consultado el 6 de octubre de 2020 .
- ^ Looveren, Pieter van de. "Funcionalidad más allá de la seguridad: el advenimiento de las cámaras de plataforma abierta" . www.securityinformed.com . Consultado el 6 de octubre de 2020 .
- ^ "StackPath" . www.securityinfowatch.com . Consultado el 6 de octubre de 2020 .
- ^ Guía de VCA de la industria británica , 262 Una introducción a la guía de la industria de análisis de contenido de video
- ^ Startup con sede en el Reino Unido que proporciona análisis de audio en la industria de CCTV
- ^ "Proyecto Natal 101" . Microsoft. 2009-06-01. Archivado desde el original el 21 de enero de 2012 . Consultado el 2 de junio de 2009 .
- ^ "Módulo inteligente de mapa de calor" .
- ^ i-Lids , iniciativa de evaluación comparativa del Ministerio del Interior del Reino Unido
- ^ "Northgate ofrece a las fuerzas policiales un sistema de análisis CCTV mejorado" . Consultado el 29 de diciembre de 2015 .
- ^ "Northgate se une a la empresa de tecnología de Dublín Kinesense para ayudar al análisis de vídeo de la policía" . Gestor de riesgos en línea . Consultado el 26 de mayo de 2014 .
- ^ TRECVID , iniciativa de referencia académica por NIST
- ^ Datos de referencia de PETS , evaluación del rendimiento de seguimiento y vigilancia (PETS) por la Universidad de Reading
- ^ Centro, UCF (17 de octubre de 2013). "UCF101 - Conjunto de datos de reconocimiento de acciones" . CRCV . Consultado el 12 de septiembre de 2018 .
- ^ "Las cámaras corporales de la policía harán más que simplemente grabarlo | Compañía rápida | El futuro de los negocios" . Empresa rápida . 2017-03-03 . Consultado el 8 de marzo de 2017 .
- ^ Sitio web del proyecto P-REACT
- ^ "Kinesense lanza P-REACT, un proyecto FP7 contra los delitos menores" . Consultado el 27 de mayo de 2014 .