Detección de copia de video

La detección de copias de video es el proceso de detectar videos copiados ilegalmente analizándolos y comparándolos con el contenido original.

El objetivo de este proceso es proteger la propiedad intelectual del creador de videos .

Historia

Indyk y col. ^[1] produjo una teoría de detección de copias de video basada en la duración de la película; sin embargo, funcionó solo para películas completas sin modificaciones. Cuando se aplica a clips cortos de un video, la técnica de Idynk et al. No detecta que el clip sea una copia.

Más tarde, ^{[ ¿cuándo? ]} Oostveen et al. introdujo el concepto de huella digital , o función hash , que crea una firma única del video basada en su contenido. Esta huella digital se basa en la duración del video y el brillo, según se determina dividiéndolo en una cuadrícula. La huella digital no se puede usar para recrear el video original porque describe solo ciertas características de su video respectivo.

Hace algún tiempo, ^{[ ¿cuándo? ]} B. Coskun y col. presentó dos algoritmos robustos basados en la transformada de coseno discreta .

Hampapur y Balle crearon un algoritmo que creaba una descripción global de una pieza de video basada en el movimiento, color, espacio, ^{[ aclaración necesaria ]} y duración del video .

Se pensó en mirar los niveles de color de la imagen, por lo que Li et al. creó un algoritmo que examina los colores de un clip creando una firma binaria obtenida del histograma de cada fotograma. ^{[ aclaración necesaria ]} Este algoritmo, sin embargo, arroja resultados inconsistentes en los casos en los que se agrega un logotipo al video, porque la inserción de los elementos de color del logotipo agrega información falsa que puede confundir al sistema.

Técnicas

Imagen con marca de agua

Marcas de agua

Las marcas de agua se utilizan para introducir una señal invisible en un video para facilitar la detección de copias ilegales. Esta técnica es muy utilizada por los fotógrafos . Colocar una marca de agua en un video de manera que la audiencia lo vea fácilmente permite al creador del contenido detectar fácilmente si la imagen se ha copiado.

La limitación de las marcas de agua es que si la imagen original no tiene marca de agua, no es posible saber si otras imágenes son copias.

Firma basada en contenido

Detección de copia de video.

En esta técnica, se crea una firma única para el video sobre la base del contenido del video. Existen varios algoritmos de detección de copia de video que utilizan características del contenido del video para asignarle una huella digital única . La huella dactilar se puede comparar con las huellas dactilares de otros videos almacenadas en una base de datos .

Este tipo de algoritmo tiene un problema importante: si varios aspectos del contenido de los videos son similares, es difícil para un algoritmo determinar si el video en cuestión es una copia del original o simplemente similar. En tal caso (por ejemplo, dos transmisiones de noticias distintas ), el algoritmo puede devolver que el video en cuestión es una copia.

Algoritmos

Los siguientes son algunos algoritmos y técnicas propuestos para la detección de copias de video.

Descriptores globales

Descriptor temporal global

En este algoritmo, una intensidad global se define como la suma de todas las intensidades de todos los píxeles ponderados a lo largo de todo el video. Por tanto, se puede construir una identidad para una muestra de vídeo sobre la base de la duración del vídeo y las intensidades de píxeles en todo momento.

La intensidad global a (t) se define como:

${\ Displaystyle a (t) = \ sum _ {i = 1} ^ {N} K (i) (I (i, t-1)) ^ {2}}$

Donde k es la ponderación de la imagen, I es la imagen y N es el número de píxeles de la imagen.

Descriptor de medición ordinal global

En este algoritmo, el video se divide en N bloques, ordenados por nivel de gris . Entonces es posible crear un vector que describa el nivel de gris promedio de cada bloque.

Con estos niveles promedio es posible crear un nuevo vector S (t) , la firma del video:

${\ Displaystyle S (t) = (r_ {1}, r_ {2}, \ cdots, r_ {N})}$

Para comparar dos videos, el algoritmo define una D (t) que representa la similitud entre ambos.

${\ Displaystyle D (t) = {\ frac {1} {T}} \ sum _ {1 = t - {\ frac {T} {2}}} ^ {t + {\ frac {T} {2}} } {\ begin {vmatrix} R (i) -C (i) \ end {vmatrix}}}$

El valor devuelto por D (t) ayuda a determinar si el video en cuestión es una copia. ^{[ aclaración necesaria ]}

Descriptores ordinales y temporales

Esta técnica fue propuesta por L.Chen y F. Stentiford. Se realiza una medición de disimilitud combinando los dos algoritmos antes mencionados, descriptores temporales globales y descriptores de medida ordinal global , en tiempo y espacio . ^{[ aclaración necesaria ]}

Descriptores locales

AJ

Descrito por A. Joly et al., Este algoritmo es una mejora del detector de puntos de interés de Harris. ^{[ aclaración necesaria (¿qué es esto?) ]} Esta técnica sugiere que en muchos videos una cantidad significativa de fotogramas son casi idénticos, por lo que es más eficiente probar no todos los fotogramas, sino solo aquellos que muestran una cantidad significativa de movimiento.

ViCopT

ViCopT usa los puntos de interés de cada imagen para definir una firma de todo el video. En cada imagen, los algoritmos identifican y definen dos partes: el fondo , un conjunto de elementos estáticos a lo largo de una secuencia temporal, y el movimiento , puntos persistentes que cambian de posición a lo largo del video.

Puntos de interés de espacio-tiempo (STIP)

Este algoritmo fue desarrollado por I. Laptev y T. Lindeberg. Utiliza la técnica de los puntos de interés a lo largo del espacio y el tiempo para definir la firma de video y crea un vector de dimensión 34 que almacena esta firma. ^{[ aclaración necesaria ]}

Exhibición de algoritmos

Existen algoritmos para la detección de copias de video que se utilizan en la actualidad. En 2007, hubo un escaparate de evaluación conocido como Entendimiento multimedia a través de la semántica, la computación y el aprendizaje (MUSCLE) , que probó algoritmos de detección de copia de video en varias muestras de video que van desde grabaciones de videos domésticos hasta segmentos de programas de televisión que van desde un minuto a una hora en largo.

Referencias

^ P. Indyk, G. Iyengar y N. Shivakumar. Encontrar secuencias de video pirateadas en Internet. Informe técnico, Universidad de Stanford, 1999.

MUSCLE (Comprensión multimedia a través de la semántica, la computación y el aprendizaje) (en inglés)
IBM - Exploring Computer vision group (en inglés)
"Un estudio comparativo" (PDF) . (563 KB) (en inglés)

[1] P. Indyk, G. Iyengar y N. Shivakumar. Encontrar secuencias de video pirateadas en Internet. Informe técnico, Universidad de Stanford, 1999.

[1]