Recuperación de imágenes basada en contenido


La recuperación de imágenes basada en contenido , también conocida como consulta por contenido de imagen ( QBIC ) y recuperación de información visual basada en contenido ( CBVIR ), es la aplicación de técnicas de visión por computadora al problema de recuperación de imágenes , es decir, el problema de la búsqueda de imágenes digitales . en grandes bases de datos (consulte esta encuesta [1] para obtener una descripción científica del campo CBIR). La recuperación de imágenes basada en contenido se opone a los enfoques tradicionales basados ​​en conceptos (consulte Indexación de imágenes basada en conceptos ).

"Basado en el contenido" significa que la búsqueda analiza el contenido de la imagen en lugar de los metadatos , como palabras clave, etiquetas o descripciones asociadas con la imagen. El término "contenido" en este contexto puede referirse a colores, formas, texturas o cualquier otra información que pueda derivarse de la imagen misma. CBIR es deseable porque las búsquedas que se basan exclusivamente en metadatos dependen de la calidad y la integridad de las anotaciones .

Hacer que los humanos anoten manualmente las imágenes ingresando palabras clave o metadatos en una gran base de datos puede llevar mucho tiempo y es posible que no capture las palabras clave deseadas para describir la imagen. La evaluación de la efectividad de la búsqueda de imágenes de palabras clave es subjetiva y no ha sido bien definida. Del mismo modo, los sistemas CBIR tienen desafíos similares para definir el éxito. [2] "Las palabras clave también limitan el alcance de las consultas al conjunto de criterios predeterminados". y "habiendo sido configurado" son menos confiables que usar el contenido en sí. [3]

El término "recuperación de imágenes basada en contenido" parece haberse originado en 1992 cuando fue utilizado por el ingeniero del laboratorio electrotécnico japonés Toshikazu Kato para describir experimentos de recuperación automática de imágenes de una base de datos, en función de los colores y las formas presentes. [2] [4] Desde entonces, el término se ha utilizado para describir el proceso de recuperación de imágenes deseadas de una gran colección sobre la base de las características sintácticas de la imagen. Las técnicas, herramientas y algoritmos que se utilizan se originan en campos como la estadística, el reconocimiento de patrones, el procesamiento de señales y la visión artificial. [1]

El primer sistema CBIR comercial fue desarrollado por IBM y se denominó QBIC ( Query By I mage C ontent ) . [5] [6] Los enfoques recientes basados ​​en redes y gráficos han presentado una alternativa simple y atractiva a los métodos existentes. [7]

Si bien el almacenamiento de múltiples imágenes como parte de una sola entidad precedió al término BLOB ( objeto binario grande ), [8] la capacidad de buscar completamente por contenido, en lugar de por descripción, tuvo que esperar al QBIC de IBM . [3]


Esquema general de recuperación de imágenes basada en contenido