Impresión de video (visión por computadora)

Propuesta como una extensión de epítomes de imagen en el campo del análisis de contenido de video , la impresión de video se obtiene refundiendo los contenidos de video en una representación de tensor de tamaño fijo ^[1]^[2], independientemente de la resolución o la duración del video. Específicamente, las características estadísticas se conservan hasta cierto punto para que las tareas comunes de reconocimiento de video puedan llevarse a cabo directamente en dichas impresiones, por ejemplo, recuperación de eventos, localización de acciones temporales. ^[2] Se afirma que se tienen en cuenta las interdependencias espacio-temporales y se mitigan las redundancias durante el cálculo de las huellas de vídeo.

La opción de computar impresiones de video explotando el modelo epítome ^[3] tiene la ventaja de formatos de características de entrada más flexibles y una etapa de entrenamiento más eficiente para el análisis de contenido de video .