Recuperación de imágenes basada en contenido


La recuperación de imágenes basada en contenido , también conocida como consulta por contenido de imagen ( QBIC ) y recuperación de información visual basada en contenido ( CBVIR ), es la aplicación de técnicas de visión por computadora al problema de recuperación de imágenes , es decir, el problema de la búsqueda de imágenes digitales. en grandes bases de datos (consulte esta encuesta [1] para obtener una descripción científica del campo CBIR). La recuperación de imágenes basada en contenido se opone a los enfoques tradicionales basados ​​en conceptos (consulte Indexación de imágenes basada en conceptos ).

"Basado en contenido" significa que la búsqueda analiza el contenido de la imagen en lugar de los metadatos como palabras clave, etiquetas o descripciones asociadas con la imagen. El término "contenido" en este contexto puede referirse a colores, formas, texturas o cualquier otra información que pueda derivarse de la propia imagen. CBIR es deseable porque las búsquedas que se basan exclusivamente en metadatos dependen de la calidad y la integridad de las anotaciones .

Hacer que los humanos anoten manualmente las imágenes ingresando palabras clave o metadatos en una gran base de datos puede llevar mucho tiempo y es posible que no capture las palabras clave deseadas para describir la imagen. La evaluación de la eficacia de la búsqueda de imágenes de palabras clave es subjetiva y no ha sido bien definida. En el mismo sentido, los sistemas CBIR tienen desafíos similares para definir el éxito. [2] "Las palabras clave también limitan el alcance de las consultas al conjunto de criterios predeterminados". y, "habiendo sido configurados" son menos confiables que usar el contenido en sí. [3]

El término "recuperación de imágenes basada en contenido" parece haberse originado en 1992 cuando fue utilizado por el ingeniero del Laboratorio Electrotécnico Japonés Toshikazu Kato para describir experimentos sobre la recuperación automática de imágenes de una base de datos, basándose en los colores y formas presentes. [2] [4] Desde entonces, el término se ha utilizado para describir el proceso de recuperación de imágenes deseadas de una gran colección sobre la base de características sintácticas de la imagen. Las técnicas, herramientas y algoritmos que se utilizan se originan en campos como la estadística, el reconocimiento de patrones, el procesamiento de señales y la visión por computadora. [1]

La exploración de videos basada en contenido fue presentada por el ingeniero iraní Farshid Arman, el científico informático taiwanés Arding Hsu y el científico informático Ming-Yee Chiu, mientras trabajaba en Siemens , y se presentó en la Conferencia Internacional ACM en agosto de 1993. [5] [6 ] Describieron un algoritmo de detección de tomas para video comprimido que originalmente se codificó con estándares de codificación de video de transformada de coseno discreta (DCT) como JPEG , MPEG y H.26x. La idea básica era que, dado que los coeficientes DCT están relacionados matemáticamente con el dominio espacial y representan el contenido de cada cuadro, pueden usarse para detectar las diferencias entre cuadros de video. En el algoritmo, un subconjunto de bloques en una trama y un subconjunto de coeficientes DCT para cada bloque se utilizan como representación del vector de movimiento para la trama. Al operar en representaciones DCT comprimidas, el algoritmo reduce significativamente los requisitos computacionales para la descompresión y permite una navegación de video efectiva. [7]El algoritmo representa tomas separadas de una secuencia de video mediante un fotograma r, una miniatura de la toma enmarcada por una región de seguimiento de movimiento. Posteriormente se adoptó una variación de este concepto para los mosaicos de contenido de video QBIC, donde cada fotograma r es un fotograma destacado de la toma que representa. [8]

El sistema CBIR comercial más antiguo fue desarrollado por IBM y fue llamado QBIC ( Q uery B y me mago C ontenido). [9] [10] Los enfoques recientes basados ​​en redes y gráficos han presentado una alternativa simple y atractiva a los métodos existentes. [11]


Esquema general de recuperación de imágenes basada en contenido