La inteligencia artificial para la videovigilancia utiliza programas de software que analizan el audio y las imágenes de las cámaras de videovigilancia para reconocer humanos, vehículos, objetos y eventos. El programa de contratistas de seguridad es el software para definir áreas restringidas dentro de la vista de la cámara (como un área cercada, un estacionamiento, pero no la acera o la calle pública fuera del estacionamiento) y el programa para las horas del día (como después del cierre del horario comercial). ) para que la propiedad esté protegida por la cámara de vigilancia . La inteligencia artificial ("IA") envía una alerta si detecta a un intruso que infringe la "regla" establecida de que no se permite a ninguna persona en esa área durante ese momento del día. [1]
El programa de IA funciona mediante el uso de visión artificial . La visión artificial es una serie de algoritmos , o procedimientos matemáticos, que funcionan como un diagrama de flujo o una serie de preguntas para comparar el objeto visto con cientos de miles de imágenes de referencia almacenadas de humanos en diferentes posturas, ángulos, posiciones y movimientos. La IA se pregunta si el objeto observado se mueve como las imágenes de referencia, si tiene aproximadamente el mismo tamaño de altura en relación con el ancho, si tiene la característica dos brazos y dos piernas, si se mueve con una velocidad similar y si es vertical en su lugar. de horizontal. Son posibles muchas otras preguntas, como el grado de reflexión del objeto, el grado de estabilidad o vibración y la suavidad con la que se mueve. Combinando todos los valores de las diversas preguntas, se obtiene una clasificación general que le da a la IA la probabilidad de que el objeto sea o no un humano. Si el valor supera un límite establecido, se envía la alerta. Es característico de estos programas que se aprendan por sí mismos hasta cierto punto, aprendiendo, por ejemplo, que los seres humanos o los vehículos parecen más grandes en ciertas partes de la imagen monitoreada, esas áreas cercanas a la cámara, que en otras partes, siendo las áreas más alejadas. desde la cámara.
Además de la regla simple que restringe a personas o vehículos en ciertas áreas en ciertos momentos del día, se pueden establecer reglas más complejas. El usuario del sistema puede querer saber si los vehículos circulan en una dirección pero no en la otra. Es posible que los usuarios deseen saber que hay más de un cierto número preestablecido de personas dentro de un área en particular. La IA es capaz de mantener la vigilancia de cientos de cámaras simultáneamente. Su capacidad para detectar a un intruso en la distancia o bajo la lluvia o el resplandor es superior a la capacidad de los humanos para hacerlo.
Este tipo de inteligencia artificial para la seguridad se conoce como " basado en reglas " porque un programador humano debe establecer reglas para todas las cosas por las que el usuario desea ser alertado. Esta es la forma más común de inteligencia artificial para la seguridad. Hoy en día, muchos sistemas de cámaras de videovigilancia incluyen este tipo de capacidad de inteligencia artificial. El disco duro que alberga el programa puede estar ubicado en las propias cámaras o puede estar en un dispositivo separado que recibe la entrada de las cámaras.
Se ha desarrollado una forma más nueva de inteligencia artificial para la seguridad, no basada en reglas, llamada " análisis de comportamiento ". Este software es totalmente de autoaprendizaje sin entrada de programación inicial por parte del usuario o del contratista de seguridad. En este tipo de análisis , la IA aprende cuál es el comportamiento normal de las personas, los vehículos, las máquinas y el entorno basándose en su propia observación de patrones de diversas características como tamaño, velocidad, reflectividad, color, agrupación, orientación vertical u horizontal y así sucesivamente. La IA normaliza los datos visuales, lo que significa que clasifica y etiqueta los objetos y patrones que observa, construyendo definiciones continuamente refinadas de lo que es el comportamiento normal o promedio para los diversos objetos observados. Después de varias semanas de aprender de esta manera, puede reconocer cuando las cosas rompen el patrón. Cuando observa tales anomalías envía una alerta. Por ejemplo, es normal que los coches circulen por la calle. Un automóvil visto conduciendo hacia una acera sería una anomalía. Si un patio cercado normalmente está vacío por la noche, entonces una persona que ingrese a esa área sería una anomalía.
Historia
Planteamiento del problema
Las limitaciones en la capacidad de los humanos para monitorear atentamente las imágenes en vivo de la videovigilancia llevaron a la demanda de inteligencia artificial que pudiera cumplir mejor la tarea. Los seres humanos que miran un solo monitor de video durante más de veinte minutos pierden el 95% de su capacidad para mantener la atención suficiente para discernir eventos importantes. [2] Con dos monitores, esto se reduce a la mitad nuevamente. [3] Dado que muchas instalaciones tienen docenas o incluso cientos de cámaras, la tarea está claramente más allá de la capacidad humana. En general, las vistas de la cámara de pasillos vacíos, instalaciones de almacenamiento, estacionamientos o estructuras son extremadamente aburridas y, por lo tanto, la atención se atenúa rápidamente. Cuando se monitorean varias cámaras, generalmente empleando un monitor de pared o un banco de monitores con vistas de pantalla dividida y rotando cada varios segundos entre un conjunto de cámaras y el siguiente, el tedio visual es rápidamente abrumador. Si bien las cámaras de videovigilancia proliferaron con una gran adopción por parte de los usuarios, desde concesionarios de automóviles y plazas comerciales hasta escuelas y negocios, pasando por instalaciones de alta seguridad, como plantas nucleares, se reconoció en retrospectiva que la videovigilancia por parte de oficiales humanos (también llamados "operadores") no era práctica. e ineficaz. Los extensos sistemas de videovigilancia quedaron relegados a la mera grabación para un posible uso forense para identificar a alguien, después del hecho de un robo, incendio provocado, ataque o incidente. Cuando se emplearon vistas de cámara de gran angular, particularmente para grandes áreas al aire libre, se descubrieron severas limitaciones incluso para este propósito debido a una resolución insuficiente. [4] En estos casos, es imposible identificar al intruso o agresor porque su imagen es demasiado pequeña en el monitor. Podemos reconocer a los humanos por separado, animales, vehículos, inteligencia artificial y cerebro humano.
Intentos anteriores de solución
Cámaras de detección de movimiento
En respuesta a las deficiencias de los guardias humanos para vigilar los monitores de vigilancia a largo plazo, la primera solución fue agregar detectores de movimiento a las cámaras. Se razonó que el movimiento de un intruso o perpetrador enviaría una alerta al oficial de monitoreo remoto obviando la necesidad de una vigilancia humana constante. El problema era que en un entorno exterior hay un movimiento constante o cambios de píxeles que comprenden la imagen total visualizada en la pantalla. El movimiento de las hojas de los árboles que se mueven con el viento, la basura en el suelo, los insectos, los pájaros, los perros, las sombras, los faros, los rayos del sol, etc., forman parte del movimiento. Esto provocó cientos o incluso miles de alertas falsas por día, lo que hizo que esta solución no funcionara, excepto en entornos interiores durante las horas de inactividad.
Detección de movimiento por video avanzada
La siguiente evolución redujo las falsas alertas hasta cierto punto, pero a costa de una complicada y lenta calibración manual. Aquí, se detectan los cambios de un objetivo, como una persona o un vehículo, con respecto a un fondo fijo. Cuando el fondo cambia estacionalmente o debido a otros cambios, la confiabilidad se deteriora con el tiempo. La economía de responder a demasiadas alertas falsas volvió a ser un obstáculo y esta solución no fue suficiente.
Advenimiento de la verdadera analítica de video
El aprendizaje automático del reconocimiento visual se relaciona con los patrones y su clasificación. [5] [6] El análisis de video real puede distinguir la forma humana, vehículos y barcos u objetos seleccionados del movimiento general de todos los demás objetos y estática visual o cambios en píxeles en el monitor. Lo hace reconociendo patrones . Cuando el objeto de interés, por ejemplo un ser humano, viola una regla preestablecida, por ejemplo, que el número de personas no excederá de cero en un área predefinida durante un intervalo de tiempo definido, se envía una alerta. Un rectángulo rojo o el llamado "cuadro delimitador" normalmente seguirá automáticamente al intruso detectado, y se envía un breve video de esto como alerta.
Aplicación práctica
Acción preventiva en tiempo real
La detección de intrusos mediante videovigilancia tiene limitaciones basadas en la economía y la naturaleza de las cámaras de video. Por lo general, las cámaras al aire libre están configuradas para una vista de gran angular y, sin embargo, miran hacia una gran distancia. La velocidad de fotogramas por segundo y el rango dinámico para manejar áreas muy iluminadas y con poca luz desafían aún más a la cámara para que sea realmente adecuada para ver a un intruso humano en movimiento. Por la noche, incluso en áreas iluminadas al aire libre, un sujeto en movimiento no recolecta suficiente luz por cuadro por segundo y, por lo tanto, a menos que esté muy cerca de la cámara, aparecerá como un hilo delgado o un fantasma apenas perceptible o completamente invisible. Las condiciones de deslumbramiento, oscurecimiento parcial, lluvia, nieve, niebla y oscuridad agravan el problema. Incluso cuando se indica a un humano que mire la ubicación real en un monitor de un sujeto en estas condiciones, el sujeto normalmente no será detectado. La IA puede mirar imparcialmente la imagen completa y las imágenes de todas las cámaras simultáneamente. Usando modelos estadísticos de grados de desviación de su patrón aprendido de lo que constituye la forma humana, detectará un intruso con alta confiabilidad y una baja tasa de falsas alertas incluso en condiciones adversas. [7] Su aprendizaje se basa en aproximadamente un cuarto de millón de imágenes de humanos en varias posiciones, ángulos, posturas, etc.
Una cámara de un megapíxel con análisis de video integrado pudo detectar a un humano a una distancia de aproximadamente 350 'y un ángulo de visión de aproximadamente 30 grados en condiciones no ideales. Se pueden establecer reglas para una "valla virtual" o una intrusión en un área predefinida. Se pueden establecer reglas para el desplazamiento direccional, el objeto dejado atrás, la formación de multitudes y algunas otras condiciones. La inteligencia artificial para la videovigilancia se utiliza ampliamente en China. Consulte Vigilancia masiva en China .
Hablar abajo
Una de las características más poderosas del sistema es que un oficial u operador humano, al recibir una alerta de la IA, podría hablar inmediatamente al intruso a través de altavoces de megafonía al aire libre. Esto tenía un alto valor de disuasión ya que la mayoría de los delitos son oportunistas y el riesgo de captura para el intruso se vuelve tan pronunciado cuando una persona viva está hablando con él que es muy probable que desista de la intrusión y se retire. El oficial de seguridad describiría las acciones del intruso para que el intruso no tuviera ninguna duda de que una persona real los estaba mirando. El oficial anunciaría que el intruso estaba infringiendo la ley y que se estaba contactando a la policía y que estaban siendo grabados en video. [8]
Informe de incumplimiento verificado
La policía recibe una gran cantidad de falsas alarmas de alarmas antirrobo. De hecho, la industria de la seguridad informa que más del 98% de estas alarmas son falsas. En consecuencia, la policía da una respuesta de muy baja prioridad a las alarmas antirrobo y puede tardar entre veinte minutos y dos horas en responder al sitio. Por el contrario, el delito detectado por videoanálisis se denuncia al supervisor central, quien verifica con sus propios ojos que se trata de un delito real en curso. A continuación, envía a la policía, quienes dan a esas llamadas su máxima prioridad.
Analítica de comportamiento
Entornos activos
Si bien el análisis de video basado en reglas funcionó de manera económica y confiable para muchas aplicaciones de seguridad, hay muchas situaciones en las que no puede funcionar. [9] Para un área interior o exterior donde nadie pertenece durante ciertas horas del día, por ejemplo durante la noche, o para áreas donde nadie pertenece en ningún momento, como una torre celular , los análisis tradicionales basados en reglas son perfectamente apropiados. En el ejemplo de una torre de telefonía celular, el raro momento en que un técnico de servicio puede necesitar acceder al área simplemente requeriría llamar con un código de acceso para poner la respuesta de monitoreo "a prueba" o inactivada por el breve tiempo que la persona autorizada estuvo allí. .
Pero hay muchas necesidades de seguridad en entornos activos en los que cientos o miles de personas pertenecen en todo el lugar todo el tiempo. Por ejemplo, un campus universitario, una fábrica activa, un hospital o cualquier instalación operativa activa. No es posible establecer reglas que discriminen entre personas legítimas y criminales o malhechores.
Superar el problema de los entornos activos
Mediante el análisis del comportamiento, una IA de autoaprendizaje y no basada en reglas toma los datos de las cámaras de video y clasifica continuamente los objetos y eventos que ve. Por ejemplo, una persona que cruza una calle es una clasificación. Un grupo de personas es otra clasificación. Un vehículo es una clasificación, pero con el aprendizaje continuo, un autobús público sería discriminado de un camión pequeño y el de una motocicleta. Con creciente sofisticación, el sistema reconoce patrones en el comportamiento humano. Por ejemplo, podría observar que los individuos atraviesan una puerta de acceso controlado de uno en uno. La puerta se abre, la persona presenta su tarjeta o etiqueta de proximidad, la persona pasa y la puerta se cierra. Este patrón de actividad, observado repetidamente, forma la base de lo que es normal en la vista de la cámara que observa esa escena. Ahora bien, si una persona autorizada abre la puerta, pero una segunda persona no autorizada que "pasa por detrás" agarra la puerta antes de que se cierre y la atraviese, ese es el tipo de anomalía que crearía una alerta. Este tipo de análisis es mucho más complejo que el análisis basado en reglas. Mientras que el análisis basado en reglas funciona principalmente para detectar intrusos en áreas donde normalmente no hay nadie presente en momentos definidos del día, el análisis de comportamiento funciona donde las personas están activas para detectar cosas que están fuera de lo común.
Un incendio al aire libre sería un evento inusual y causaría una alerta, al igual que una nube de humo en aumento. Los vehículos que circulan en sentido contrario a un camino de entrada de un solo sentido también tipificarían el tipo de evento que tiene una marca visual fuerte y se desviaría del patrón observado repetidamente de vehículos que conducen en el sentido único correcto en el carril. Alguien arrojado al suelo por un atacante sería un evento inusual que probablemente causaría una alerta. Esto es específico de la situación. Entonces, si la cámara viera un gimnasio donde se practicaba la lucha libre, la IA aprendería que es habitual que un humano arroje a otro al suelo, en cuyo caso no alertaría sobre esta observación.
Lo que 'entiende' la inteligencia artificial
La IA no sabe ni comprende qué es un ser humano, un incendio o un vehículo. Es simplemente encontrar características de estas cosas en función de su tamaño, forma, color, reflectividad, ángulo, orientación, movimiento, etc. Luego descubre que los objetos que ha clasificado tienen patrones típicos de comportamiento. Por ejemplo, los humanos caminan por las aceras y, a veces, por las calles, pero no suelen trepar por los lados de los edificios. Los vehículos circulan por las calles, pero no por las aceras. Por lo tanto, el comportamiento anómalo de alguien que escala un edificio o un vehículo que se desvía hacia una acera dispararía una alerta.
Varía de la mentalidad tradicional de los sistemas de seguridad.
Los sistemas de alarma típicos están diseñados para no perder verdaderos positivos (eventos delictivos reales) y para tener una tasa de falsas alarmas lo más baja posible. En ese sentido, las alarmas antirrobo pasan por alto muy pocos positivos verdaderos, pero tienen una tasa de falsas alarmas muy alta incluso en el ambiente interior controlado. Las cámaras de detección de movimiento pierden algunos positivos verdaderos, pero están plagadas de falsas alarmas abrumadoras en un entorno al aire libre. El análisis basado en reglas detecta de manera confiable la mayoría de los verdaderos positivos y tiene una baja tasa de falsos positivos, pero no puede funcionar en entornos activos, solo en entornos vacíos. También se limitan a la simple discriminación de si un intruso está presente o no.
Algo tan complejo o sutil como una pelea o un empleado que rompe un procedimiento de seguridad no es posible para que un análisis basado en reglas lo detecte o discrimine. Con el análisis del comportamiento, lo es. Los lugares donde las personas se mueven y trabajan no presentan ningún problema. Sin embargo, la IA puede detectar muchas cosas que parecen anómalas pero que son de naturaleza inocente. Por ejemplo, si los estudiantes de un campus caminan por una plaza, se aprenderá con normalidad. Si un par de estudiantes decidieran llevar una sábana grande al aire libre ondeando en el viento, eso de hecho podría desencadenar una alerta. El oficial de monitoreo sería alertado para mirar su monitor y vería que el evento no es una amenaza y luego lo ignoraría. El grado de desviación de la norma que activa una alerta se puede configurar para que solo se informen las cosas más anormales. Sin embargo, esto todavía constituye una nueva forma de interacción humana y de inteligencia artificial no tipificada por la mentalidad tradicional de la industria de las alarmas. Esto se debe a que habrá muchas falsas alarmas que, no obstante, pueden ser valiosas para enviar a un oficial humano que pueda mirar rápidamente y determinar si la escena requiere una respuesta. En este sentido, es un "toque en el hombro" de la IA para que el humano mire algo.
Limitaciones de la analítica del comportamiento
Debido a que muchas cosas complejas se procesan continuamente, el software muestra hasta la resolución muy baja de solo 1 CIF para conservar la demanda computacional. La resolución de 1 CIF significa que un objeto del tamaño de un humano no será detectado si la cámara utilizada es gran angular y el humano está a más de veinte a veinticinco metros de distancia, según las condiciones. Los objetos más grandes, como vehículos o humo, serían detectables a mayores distancias.
Cuantificación de la conciencia situacional
La utilidad de la inteligencia artificial para la seguridad no existe en el vacío, y su desarrollo no fue impulsado por un estudio puramente académico o científico. Más bien, se dirige a las necesidades del mundo real y, por tanto, a las fuerzas económicas. Su uso para aplicaciones que no son de seguridad, como la eficiencia operativa, el mapeo de calor del comprador de las áreas de exhibición (es decir, cuántas personas hay en un área determinada en el espacio comercial) y la asistencia a clases, están desarrollando usos. [10] Los seres humanos no están tan bien calificados como la IA para compilar y reconocer patrones que consisten en conjuntos de datos muy grandes que requieren cálculos simultáneos en múltiples ubicaciones vistas remotas. No hay nada de humano nativo en tal conciencia. Se ha demostrado que esta multitarea desenfoca la atención y el rendimiento humanos. Las IA tienen la capacidad de manejar esos datos. A los efectos de la seguridad al interactuar con las cámaras de video, funcionalmente tienen una mejor agudeza visual que los humanos o la aproximación de la máquina a ella. Para juzgar las sutilezas de los comportamientos o las intenciones de los sujetos o los grados de amenaza, los humanos siguen siendo muy superiores en el estado actual de la tecnología. Por lo tanto, la inteligencia artificial en las funciones de seguridad escanea ampliamente más allá de la capacidad humana y examina los datos a un primer nivel de clasificación de relevancia y alerta al oficial humano que luego asume la función de evaluación y respuesta.
La seguridad en el mundo práctico se determina económicamente, de modo que el gasto de seguridad preventiva nunca excederá el costo percibido del riesgo a evitar. Los estudios han demostrado que las empresas normalmente solo gastan alrededor de un veinticinco por ciento de la cantidad en seguridad que les cuestan sus pérdidas reales. [11] Lo que por pura teoría económica debería ser una equivalencia u homeostasis, por lo tanto, está muy por debajo de ella. Una teoría que explica esto es la disonancia cognitiva , o la facilidad con la que cosas desagradables como el riesgo se pueden desviar de la mente consciente. Sin embargo, la seguridad es un gasto importante y la comparación de los costos de diferentes medios de seguridad es siempre lo más importante entre los profesionales de la seguridad.
Otra razón por la que se subestiman las amenazas o pérdidas de seguridad futuras es que a menudo solo se considera el costo directo de una pérdida potencial en lugar del espectro de pérdidas consecuentes que se experimentan concomitantemente. Por ejemplo, el vandalismo-destrucción de una máquina de producción personalizada en una fábrica o de un tractor-remolque refrigerado resultaría en un tiempo de reemplazo prolongado durante el cual los clientes no podrían ser atendidos, resultando en la pérdida de su negocio. Un crimen violento tendrá un gran daño en las relaciones públicas para el empleador, más allá de la responsabilidad directa por no proteger al empleado.
El análisis de comportamiento funciona de manera única más allá de la simple seguridad y, debido a su capacidad para observar infracciones en los patrones estándar de protocolos, puede encontrar de manera efectiva actos inseguros de los empleados que pueden resultar en accidentes laborales o de responsabilidad civil. También en este caso, la evaluación de los costes de futuros incidentes no se ajusta a la realidad. Un estudio realizado por Liberty Mutual Insurance Company mostró que el costo para los empleadores es aproximadamente seis veces el costo asegurado directo, ya que los costos no asegurados de daños emergentes incluyen trabajadores de reemplazo temporal, costos de contratación para reemplazos, costos de capacitación, tiempo de los gerentes en informes o tribunales, la moral de otros trabajadores y el efecto sobre los clientes y las relaciones públicas. [12] El potencial de la IA en forma de análisis de comportamiento para interceptar y prevenir este tipo de incidentes de forma proactiva es significativo.
Ver también
Referencias
- ^ "Video Analytics - una descripción general | Temas de ScienceDirect" . www.sciencedirect.com . Consultado el 1 de noviembre de 2020 .
- ^ Green, Mary W. (1999) El uso apropiado y efectivo de las tecnologías de seguridad en las escuelas de EE. UU., Una guía para escuelas y agencias de aplicación de la ley , Sandia National Laboratories
- ↑ Sulman, N .; Sanocki, T .; Goldgof, D .; Kasturi, R., ¿Qué tan efectivo es el desempeño de la videovigilancia humana? , Reconocimiento de patrones , ICPR 2008. XIX Conferencia Internacional sobre, vol., No., Págs. 1,3, 8-11 de diciembre de 2008
- ^ Nuechterlein, KH, Parasuraman, R. y Jiang, Q. (1983). Atención visual sostenida: la degradación de la imagen produce una rápida disminución de la sensibilidad con el tiempo . Ciencia, 220, 327-329
- ↑ Pedro Domingos, The Master Algorithm: How the Quest for the Ultimate Learning Machine Will Remake Our World , 22 de septiembre de 2015 Basic Books
- ^ Davies, ER (2012) Computadora y visión artificial, cuarta edición: teoría, algoritmos, practicidades Academic Press, Waltham Mass.
- ^ Dufour, Jean-Yves, Sistemas inteligentes de videovigilancia , John Wiley Publisher (2012)
- ^ Hantman, Ken (2014) ¿Qué es Video Analytics, simplemente explicado?
- ^ Rice, Derek, Encontrar y vender el valor de la analítica , Revista SDM (septiembre de 2015) BNP Media II, Troy Michigan
- ^ Gruber, Illy, The Evolution of Video Analytics , Security Sales & Integration magazine (11 de agosto de 2012) Security Sales & Integration, Framingham MA
- ^ Bressler, Martin S., The Impact of Crime on Business: A Model of Prevention, Detection & Remedy , Journal of Management and Marketing Research (2009)
- ^ Informe del índice de seguridad , Liberty Mutual Insurance Company (2002)