Detección de transición de toma


La detección de transición de toma (o simplemente detección de toma ), también llamada detección de corte, es un campo de investigación del procesamiento de video . Su objeto es la detección automatizada de transiciones entre tomas en video digital con el propósito de segmentación temporal de videos. [1]

La detección de transición de planos se utiliza para dividir una película en unidades temporales básicas denominadas planos ; una toma es una serie de fotografías consecutivas interrelacionadas tomadas de manera contigua por una sola cámara y que representan una acción continua en el tiempo y el espacio. [2]

Esta operación es de gran utilidad en software para postproducción de videos. También es un paso fundamental de la indexación automatizada y las aplicaciones de recuperación o resumen de video basadas en contenido que brindan un acceso eficiente a archivos de video enormes, por ejemplo, una aplicación puede elegir una imagen representativa de cada escena para crear una descripción visual de toda la película y, al procesar dichos índices, un motor de búsqueda puede procesar elementos de búsqueda como "muéstrame todas las películas en las que hay una escena con un león".

La detección de cortes no puede hacer nada que un editor humano no pueda hacer manualmente, sin embargo, es ventajoso ya que ahorra tiempo. Además, debido al aumento en el uso del vídeo digital y, en consecuencia, a la importancia de las aplicaciones de indexación antes mencionadas, la detección automática de cortes es muy importante en la actualidad.

En términos simples, la detección de cortes se trata de encontrar las posiciones en un video en el que una escena es reemplazada por otra con contenido visual diferente. Técnicamente hablando, se utilizan los siguientes términos:

Un video digital consta de fotogramas que se presentan al ojo del espectador en rápida sucesión para crear la impresión de movimiento. "Digital" en este contexto significa tanto que un solo cuadro consta de píxeles como que los datos están presentes como datos binarios , de modo que se pueden procesar con una computadora. Cada cuadro dentro de un video digital se puede identificar de forma única por su índice de cuadro , un número de serie.


Una transición abrupta .
El fundido mezcla gradualmente una toma con otra con un efecto de transparencia.
Detección de cortes. (1) Golpe : un corte fuerte detectado. (2) Acierto fallido : un corte suave ( disolver ), que no se detectó. (3) Golpe falso : un solo corte suave que se interpreta falsamente como dos cortes duros diferentes.