La recuperación de imágenes basada en contenido , también conocida como consulta por contenido de imagen ( QBIC ) y recuperación de información visual basada en contenido ( CBVIR ), es la aplicación de técnicas de visión por computadora al problema de recuperación de imágenes , es decir, el problema de la búsqueda de imágenes digitales. en grandes bases de datos (consulte esta encuesta [1] para obtener una descripción científica del campo CBIR). La recuperación de imágenes basada en contenido se opone a los enfoques tradicionales basados en conceptos (consulte Indexación de imágenes basada en conceptos ).
"Basado en contenido" significa que la búsqueda analiza el contenido de la imagen en lugar de los metadatos como palabras clave, etiquetas o descripciones asociadas con la imagen. El término "contenido" en este contexto puede referirse a colores, formas, texturas o cualquier otra información que pueda derivarse de la propia imagen. CBIR es deseable porque las búsquedas que se basan exclusivamente en metadatos dependen de la calidad y la integridad de las anotaciones .
Hacer que los humanos anoten imágenes manualmente ingresando palabras clave o metadatos en una gran base de datos puede llevar mucho tiempo y es posible que no capture las palabras clave deseadas para describir la imagen. La evaluación de la eficacia de la búsqueda de imágenes de palabras clave es subjetiva y no ha sido bien definida. En el mismo sentido, los sistemas CBIR tienen desafíos similares para definir el éxito. [2] "Las palabras clave también limitan el alcance de las consultas al conjunto de criterios predeterminados". y "habiendo sido configurados" son menos confiables que usar el contenido en sí. [3]
Historia
El término "recuperación de imágenes basada en contenido" parece haberse originado en 1992 cuando fue utilizado por el ingeniero del Laboratorio Electrotécnico Japonés Toshikazu Kato para describir experimentos sobre la recuperación automática de imágenes de una base de datos, basándose en los colores y formas presentes. [2] [4] Desde entonces, el término se ha utilizado para describir el proceso de recuperación de imágenes deseadas de una gran colección sobre la base de características sintácticas de la imagen. Las técnicas, herramientas y algoritmos que se utilizan se originan en campos como la estadística, el reconocimiento de patrones, el procesamiento de señales y la visión por computadora. [1]
La exploración de videos basada en contenido fue presentada por el ingeniero iraní Farshid Arman, el científico informático taiwanés Arding Hsu y el científico informático Ming-Yee Chiu, mientras trabajaba en Siemens , y se presentó en la Conferencia Internacional ACM en agosto de 1993. [5] [6 ] Describieron un algoritmo de detección de tomas para video comprimido que originalmente se codificó con estándares de codificación de video de transformada de coseno discreta (DCT) como JPEG , MPEG y H.26x . La idea básica era que, dado que los coeficientes DCT están relacionados matemáticamente con el dominio espacial y representan el contenido de cada cuadro, pueden usarse para detectar las diferencias entre cuadros de video. En el algoritmo, un subconjunto de bloques en una trama y un subconjunto de coeficientes DCT para cada bloque se utilizan como representación del vector de movimiento para la trama. Al operar en representaciones DCT comprimidas, el algoritmo reduce significativamente los requisitos computacionales para la descompresión y permite una navegación de video efectiva. [7] El algoritmo representa tomas separadas de una secuencia de video mediante un fotograma r, una miniatura de la toma enmarcada por una región de seguimiento de movimiento. Posteriormente se adoptó una variación de este concepto para los mosaicos de contenido de video QBIC, donde cada fotograma r es un fotograma destacado de la toma que representa. [8]
QBIC : consulta por contenido de imagen
El sistema CBIR comercial más antiguo fue desarrollado por IBM y fue llamado QBIC ( Q uery B y me mago C ontenido). [9] [10] Los enfoques recientes basados en redes y gráficos han presentado una alternativa simple y atractiva a los métodos existentes. [11]
Mientras que el almacenamiento de múltiples imágenes como parte de una sola entidad precedió al término BLOB ( B inary L arge OB ject), [12] la capacidad de buscar completamente por contenido, en lugar de por descripción, tuvo que esperar al QBIC de IBM. [3]
Progreso técnico
El interés en CBIR ha crecido debido a las limitaciones inherentes a los sistemas basados en metadatos, así como a la amplia gama de posibles usos para la recuperación eficiente de imágenes. La información textual sobre imágenes se puede buscar fácilmente utilizando la tecnología existente, pero esto requiere que los humanos describan manualmente cada imagen en la base de datos. Esto puede resultar poco práctico para bases de datos muy grandes o para imágenes que se generan automáticamente, por ejemplo, las de cámaras de vigilancia . También es posible que se pierdan imágenes que utilizan diferentes sinónimos en sus descripciones. Los sistemas basados en la categorización de imágenes en clases semánticas como "gato" como una subclase de "animal" pueden evitar el problema de clasificación errónea, pero requerirán más esfuerzo por parte del usuario para encontrar imágenes que podrían ser "gatos", pero que solo se clasifican como " animal". Se han desarrollado muchos estándares para categorizar imágenes, pero todos aún enfrentan problemas de escalado y categorización errónea. [2]
Los sistemas CBIR iniciales se desarrollaron para buscar bases de datos basadas en el color de la imagen, la textura y las propiedades de la forma. Después de que se desarrollaron estos sistemas, se hizo evidente la necesidad de interfaces fáciles de usar. Por lo tanto, los esfuerzos en el campo CBIR comenzaron a incluir un diseño centrado en el ser humano que intentaba satisfacer las necesidades del usuario que realizaba la búsqueda. Por lo general, esto significa la inclusión de: métodos de consulta que pueden permitir la semántica descriptiva, consultas que pueden involucrar comentarios de los usuarios, sistemas que pueden incluir aprendizaje automático y sistemas que pueden comprender los niveles de satisfacción del usuario. [1]
Técnicas
Se han desarrollado muchos sistemas CBIR, pero a partir de 2006[actualizar], el problema de recuperar imágenes sobre la base de su contenido de píxeles sigue sin resolverse en gran medida. [1] [ necesita actualización ]
Las diferentes técnicas de consulta e implementaciones de CBIR hacen uso de diferentes tipos de consultas de los usuarios.
Consulta por ejemplo
QBE ( Q uery B y E jemplo ) es una técnica de consulta [13] que implica proporcionar el sistema CBIR una imagen de ejemplo que luego basará su búsqueda sobre con. Los algoritmos de búsqueda subyacentes pueden variar según la aplicación, pero las imágenes de resultados deben compartir elementos comunes con el ejemplo proporcionado. [14]
Las opciones para proporcionar imágenes de ejemplo al sistema incluyen:
- El usuario puede proporcionar una imagen preexistente o elegirla de un conjunto aleatorio.
- El usuario dibuja una aproximación aproximada de la imagen que está buscando, por ejemplo, con manchas de color o formas generales. [14]
Esta técnica de consulta elimina las dificultades que pueden surgir al intentar describir imágenes con palabras.
Recuperación semántica
La recuperación semántica comienza cuando un usuario realiza una solicitud como "buscar imágenes de Abraham Lincoln". Este tipo de tarea abierta es muy difícil de realizar para las computadoras: es posible que Lincoln no siempre esté frente a la cámara o en la misma pose. Por lo tanto, muchos sistemas CBIR generalmente utilizan características de nivel inferior como textura, color y forma. Estas características se utilizan en combinación con interfaces que permiten una entrada más fácil de los criterios o con bases de datos que ya han sido entrenadas para hacer coincidir características (como caras, huellas dactilares o coincidencia de formas). Sin embargo, en general, la recuperación de imágenes requiere retroalimentación humana para identificar conceptos de nivel superior. [10]
Retroalimentación de relevancia (interacción humana)
Combinar las técnicas de búsqueda CBIR disponibles con la amplia gama de usuarios potenciales y su intención puede ser una tarea difícil. Un aspecto del éxito de CBIR depende completamente de la capacidad de comprender la intención del usuario. [15] Los sistemas CBIR pueden hacer uso de comentarios de relevancia , donde el usuario refina progresivamente los resultados de la búsqueda marcando imágenes en los resultados como "relevantes", "no relevantes" o "neutrales" para la consulta de búsqueda, luego repitiendo la búsqueda con la nueva información. Se han desarrollado ejemplos de este tipo de interfaz. [dieciséis]
Aprendizaje iterativo / automático
El aprendizaje automático y la aplicación de técnicas iterativas se están volviendo más comunes en CBIR. [17]
Otros métodos de consulta
Otros métodos de consulta incluyen navegar por imágenes de ejemplo, navegar por categorías personalizadas / jerárquicas, consultar por región de imagen (en lugar de la imagen completa), consultar por múltiples imágenes de ejemplo, consultar por boceto visual, consultar por especificación directa de características de imagen y consultas multimodales ( por ejemplo, combinando tacto, voz, etc.) [18]
Comparación de contenido utilizando medidas de distancia de la imagen
El método más común para comparar dos imágenes en la recuperación de imágenes basada en contenido (generalmente una imagen de ejemplo y una imagen de la base de datos) es usar una medida de distancia de imagen. Una medida de distancia de imagen compara la similitud de dos imágenes en varias dimensiones, como color, textura, forma y otras. Por ejemplo, una distancia de 0 significa una coincidencia exacta con la consulta, con respecto a las dimensiones que se consideraron. Como se puede deducir intuitivamente, un valor mayor que 0 indica varios grados de similitud entre las imágenes. Los resultados de la búsqueda se pueden ordenar en función de su distancia a la imagen consultada. [14] Se han desarrollado muchas medidas de distancia de la imagen (modelos de similitud). [19]
Color
El cálculo de las medidas de distancia basadas en la similitud de color se logra calculando un histograma de color para cada imagen que identifica la proporción de píxeles dentro de una imagen que contiene valores específicos. [2] Examinar imágenes en función de los colores que contienen es una de las técnicas más utilizadas porque se puede completar sin importar el tamaño o la orientación de la imagen. [10] Sin embargo, la investigación también ha intentado segmentar la proporción de color por región y por relación espacial entre varias regiones de color. [18]
Textura
Las medidas de textura buscan patrones visuales en las imágenes y cómo se definen espacialmente. Las texturas están representadas por texels que luego se colocan en varios conjuntos, dependiendo de cuántas texturas se detecten en la imagen. Estos conjuntos no solo definen la textura, sino también en qué parte de la imagen se encuentra la textura. [14]
La textura es un concepto difícil de representar. La identificación de texturas específicas en una imagen se logra principalmente modelando la textura como una variación de nivel de gris bidimensional. El brillo relativo de los pares de píxeles se calcula de manera que se pueda estimar el grado de contraste, regularidad, aspereza y direccionalidad. [10] [20] El problema está en identificar patrones de variación de co-píxeles y asociarlos con clases particulares de texturas como sedoso o rugoso .
Otros métodos para clasificar texturas incluyen:
- Matriz de co-ocurrencia
- Leyes textura energía
- Transformada wavelet
- Transformaciones ortogonales (momentos discretos de Tchebichef)
Forma
La forma no se refiere a la forma de una imagen, sino a la forma de una región particular que se está buscando. Las formas a menudo se determinarán primero aplicando segmentación o detección de bordes a una imagen. Otros métodos utilizan filtros de forma para identificar formas determinadas de una imagen. [21] Es posible que los descriptores de forma también necesiten ser invariables a la traducción, rotación y escala. [10]
Algunos descriptores de forma incluyen: [10]
- Transformada de Fourier
- Momento invariante
Vulnerabilidades, ataques y defensas
Al igual que otras tareas de la visión por computadora , como el reconocimiento y la detección, los algoritmos de recuperación basados en redes neuronales recientes son susceptibles a ataques adversarios , tanto como candidatos como ataques de consulta. [22] Se muestra que la clasificación recuperada podría alterarse drásticamente con solo pequeñas perturbaciones imperceptibles para los seres humanos. Además, también son posibles ejemplos de adversarios transferibles agnósticos del modelo, lo que permite ataques adversarios de caja negra en sistemas de clasificación profunda sin necesidad de acceso a sus implementaciones subyacentes. [22] [23]
Por el contrario, la resistencia a tales ataques se puede mejorar mediante defensas adversas como la defensa de Madry. [24]
Evaluación de recuperación de imágenes
Las medidas de recuperación de imágenes se pueden definir en términos de precisión y recuperación . Sin embargo, se están considerando otros métodos. [25]
Recuperación de imágenes en el sistema CBIR simultáneamente mediante diferentes técnicas
Una imagen se recupera en el sistema CBIR mediante la adopción de varias técnicas simultáneamente, como la integración de la indexación de grupos de píxeles, la intersección del histograma y los métodos de transformación de ondas discretas. [26]
Aplicaciones
Los usos potenciales de CBIR incluyen: [2]
- Diseño arquitectónico e ingenieril
- Colecciones de arte
- Prevención del crimen
- Sistemas de información geográfica y teledetección
- Propiedad intelectual
- Diagnostico medico
- Militar
- Archivos fotográficos
- Catálogos minoristas
- Filtros de detección de desnudez [27]
- Encontrar rostro
- Industria textil [16]
Los sistemas comerciales que se han desarrollado incluyen: [2]
- QBIC de IBM
- Motor de imágenes VIR de Virage
- Recuperación de imágenes de Excalibur
- VisualSEEk y WebSEEk
- Netra
- MARTE
- Vhoto
- Pixolution
Los sistemas experimentales incluyen: [2]
- Fotolibro del MIT
- WebSEEk de la Universidad de Columbia
- Informedia de la Universidad Carnegie-Mellon
- iSearch - PICT
Ver también
- Clasificación de documentos
- GazoPa
- Recuperación de imágenes
- Lista de motores CBIR
- Búsqueda visual de Macroglossa
- MPEG-7
- Recuperación de información multimedia
- Aprendizaje de múltiples instancias
- Búsqueda de vecino más cercano
- Aprendiendo a clasificar
Referencias
- ^ a b c d Recuperación de información multimedia basada en contenido: estado del arte y desafíos (fuente original, 404'd) Recuperación de información multimedia basada en contenido: estado del arte y desafíos Archivado 2007-09-28 en Wayback Machine , Michael Lew , et al., ACM Transactions on Multimedia Computing, Communications, and Applications , págs. 1-19, 2006.
- ^ a b c d e f g Eakins, John; Graham, Margaret. "Recuperación de imágenes basada en contenido" . Universidad de Northumbria en Newcastle. Archivado desde el original el 5 de febrero de 2012 . Consultado el 10 de marzo de 2014 .
- ^ a b Julie Anderson (29 de abril de 1996). "Buscar imágenes / Object Design Inc - ganga del año foros de discusión de acciones (6 de agosto de 1996)" . Information Week (reimpreso en línea en Silicon Investor's Stock Discussion Forums (6 de agosto de 1996) . P. 69 (IW).
En DB Expo en San Francisco a principios de este mes ...
[ enlace muerto permanente ] - ^ Kato, Toshikazu (abril de 1992). "Arquitectura de base de datos para la recuperación de imágenes basada en contenido". Sistemas de almacenamiento y recuperación de imágenes . Sociedad Internacional de Óptica y Fotónica. 1662 : 112-123. Código Bibliográfico : 1992SPIE.1662..112K . doi : 10.1117 / 12.58497 . S2CID 14342247 .
- ^ Arman, Farshid; Hsu, Arding; Chiu, Ming-Yee (agosto de 1993). "Procesamiento de imágenes en datos comprimidos para grandes bases de datos de video" . Actas de la Primera Conferencia Internacional ACM sobre Multimedia . Asociación de Maquinaria de Computación : 267–272. doi : 10.1145 / 166266.166297 . ISBN 0897915968. S2CID 10392157 .
- ^ Arman, Farshid; Depommier, Remi; Hsu, Arding; Chiu, Ming-Yee (octubre de 1994). "Navegación basada en contenido de secuencias de video" . Actas de la Segunda Conferencia Internacional ACM sobre Multimedia . Asociación de Maquinaria de Computación : 97–103. CiteSeerX 10.1.1.476.7139 . doi : 10.1145 / 192593.192630 . ISBN 0897916867. S2CID 1360834 .
- ^ Zhang, HongJiang (1998). "Búsqueda y recuperación de videos basados en contenido" . En Furht, Borko (ed.). Manual de Sistemas y Aplicaciones de Internet y Multimedia . Prensa CRC . págs. 83-108 (89) . ISBN 9780849318580.
- ^ Steele, Michael; Hearst, Marti A .; Lawrence, A. Rowe (1998). "The Video Workbench: una interfaz de manipulación directa para la edición de medios digitales por camarógrafos aficionados". Erudito semántico : 1-19 (14). S2CID 18212394 .
- ^ Flickner, M .; Sawhney, H .; Niblack, W .; Ashley, J .; Qian Huang; Dom, B .; Gorkani, M .; Hafner, J .; Lee, D .; Petkovic, D .; Steele, D .; Yanker, P. (1995). "Consulta por contenido de imagen y video: el sistema QBIC". Computadora . 28 (9): 23–32. doi : 10.1109 / 2.410146 .
Resumen: La investigación sobre formas de ampliar y mejorar los métodos de consulta para bases de datos de imágenes está muy extendida. Hemos desarrollado el QBIC (Query by Image Content) ...
- ^ a b c d e f Rui, Yong; Huang, Thomas S .; Chang, Shih-Fu (1999). "Recuperación de imágenes: técnicas actuales, direcciones prometedoras y problemas abiertos". Revista de Comunicación Visual y Representación de Imágenes . 10 : 39–62. CiteSeerX 10.1.1.32.7819 . doi : 10.1006 / jvci.1999.0413 .[ enlace muerto permanente ]
- ^ Banerjee, SJ; et al. (2015). "Utilización de redes complejas para la recuperación de información y el diagnóstico en imágenes multidimensionales" . Informes científicos . 5 : 17271. arXiv : 1506.02602 . Código Bibliográfico : 2015NatSR ... 517271B . doi : 10.1038 / srep17271 . PMC 4667282 . PMID 26626047 .
- ^ "La verdadera historia de los BLOB" . Archivado desde el original el 23 de julio de 2011.
- ^ "Consulta por ejemplo" . KnowledgeCenter de IBM.com .
QBE es un lenguaje para realizar consultas ...
- ^ a b c d Shapiro, Linda ; George Stockman (2001). Visión por computadora . Upper Saddle River, Nueva Jersey: Prentice Hall. ISBN 978-0-13-030796-5.
- ^ Datta, Ritendra; Dhiraj Joshi; Jia Li; James Z. Wang (2008). "Recuperación de imágenes: ideas, influencias y tendencias de la nueva era" . Encuestas de computación ACM . 40 (2): 1–60. doi : 10.1145 / 1348246.1348248 . S2CID 7060187 .
- ^ a b Bird, CL; PJ Elliott, Griffiths (1996). "Interfaces de usuario para la recuperación de imágenes basadas en contenido". Cite journal requiere
|journal=
( ayuda ) - ^ Cardoso, Douglas; et al. "Técnica iterativa para la recuperación de imágenes basada en contenido utilizando múltiples conjuntos de SVM" (PDF) . Universidad Federal de Paraná (Brasil) . Consultado el 11 de marzo de 2014 .
- ^ a b Liam M. Mayron. "Recuperación de imágenes mediante atención visual" (PDF) . Mayron.net . Consultado el 18 de octubre de 2012 .
- ^ Eidenberger, Horst (2011). “Comprensión fundamental de los medios”, atpress. ISBN 978-3-8423-7917-6 .
- ^ Tamura, Hideyuki; Mori, Shunji; Yamawaki, Takashi (1978). "Características de textura correspondientes a la percepción visual". Transacciones IEEE sobre sistemas, hombre y cibernética . 8 (6): 460, 473. doi : 10.1109 / tsmc.1978.4309999 . S2CID 32197839 .
- ^ Tushabe, F .; MHF Wilkinson (2008). Recuperación de imágenes basada en contenido utilizando espectros de patrones de atributos 2D combinados (PDF) . Springer Lecture Notes en Ciencias de la Computación . Apuntes de conferencias en informática. 5152 . págs. 554–561. doi : 10.1007 / 978-3-540-85760-0_69 . ISBN 978-3-540-85759-4.
- ^ a b Zhou, Mo; Niu, Zhenxing; Wang, Le; Zhang, Qilin; Hua, Gang (2020). "Ataque y defensa de clasificación adversaria". arXiv : 2002.11293v2 [ cs.CV ].
- ^ Li, Jie; Ji, Rongrong; Liu, Hong; Hong, Xiaopeng; Gao, Yue; Tian, Qi. "Ataque de perturbación universal contra la recuperación de imágenes" . Congreso Internacional de Visión por Computador (ICCV 2019) . págs. 4899–4908.
- ^ Madry, Aleksander; Makelov, Aleksandar; Schmidt, Ludwig; Tsipras, Dimitris; Vladu, Adrian (19 de junio de 2017). "Hacia modelos de aprendizaje profundo resistentes a ataques contradictorios". arXiv : 1706.06083v4 [ stat.ML ].
- ^ Deselaers, Thomas; Keysers, Daniel; Ney, Hermann (2007). "Funciones para la recuperación de imágenes: una comparación experimental" (PDF) . Universidad RWTH Aachen . Consultado el 11 de marzo de 2014 .
- ^ Bhattacharjee, Pijush kanti (2010). "Integración de la indexación de grupos de píxeles, la intersección de histogramas y los métodos de transformación de ondas discretas para el sistema de recuperación de imágenes basado en contenido de imágenes en color" (PDF) . Revista Internacional de Ingeniería Informática y Eléctrica [IJCEE], Singapur, vol. 2, no. 2, págs. 345-352, 2010 .
- ^ Wang, James Ze; Jia Li; Gio Wiederhold; Oscar Firschein (1998). "Sistema de detección de imágenes objetables". Comunicaciones informáticas . 21 (15): 1355-1360. CiteSeerX 10.1.1.78.7689 . doi : 10.1016 / s0140-3664 (98) 00203-5 .
Otras lecturas
Artículos de investigación relevantes
- Query by Image and Video Content: The QBIC System , (Flickner, 1995)
- Encontrar gente desnuda (Fleck et al., 1996)
- Virage Video Engine [ enlace muerto permanente ] , (Hampapur, 1997)
- Codificación basada en bibliotecas: una representación para la compresión y recuperación de video eficientes (Vasconcelos & Lippman, 1997)
- Sistema de detección de imágenes objetables (Wang et al., 1998)
- Recuperación de imágenes basada en contenido (Informe 39 del programa de aplicaciones tecnológicas de JISC ) (Eakins & Graham 1999)
- Windsurf: recuperación de imágenes basada en regiones utilizando wavelets (Ardizzoni, Bartolini y Patella, 1999)
- Una arquitectura probabilística para la recuperación de imágenes basada en contenido (Vasconcelos & Lippman, 2000)
- Una visión unificadora de la similitud de imágenes (Vasconcelos & Lippman, 2000)
- Búsquedas web de próxima generación para contenido visual (Lew, 2000)
- Indexación de imágenes con jerarquías de mezcla (Vasconcelos, 2001)
- SIMPLIcity: Coincidencia integrada sensible a la semántica para bibliotecas de imágenes (Wang, Li y Wiederhold, 2001)
- Un enfoque conceptual para la recuperación de imágenes web (Popescu y Grefenstette, 2008)
- FACERET: un sistema interactivo de recuperación de rostros basado en mapas autoorganizados (Ruiz-del-Solar et al., 2002)
- Indexación lingüística automática de imágenes mediante un enfoque de modelado estadístico (Li y Wang, 2003)
- Google de video: un enfoque de recuperación de texto para la coincidencia de objetos en videos (Sivic & Zisserman, 2003)
- Probabilidad mínima de recuperación de imágenes de error (Vasconcelos, 2004)
- Sobre la evaluación eficiente de funciones de similitud probabilística para la recuperación de imágenes (Vasconcelos, 2004)
- Ampliación de los sistemas de recuperación de imágenes con un diccionario de sinónimos de formas (Hove, 2004)
- Nombres y rostros en las noticias (Berg et al., 2004)
- Cortina: un sistema para la recuperación de imágenes web a gran escala, basado en contenido (Quack et al., 2004)
- Una nueva perspectiva sobre la recuperación de información visual (Eidenberger 2004)
- Consulta lingüística de colecciones de imágenes sobre la base de una ontología extensible (Town y Sinclair, 2004)
- El motor de exploración de imágenes personalizable PIBE (Bartolini, Ciaccia y Patella, 2004)
- Vestuario: una nueva función para la indexación automática de contenido de video (Jaffre 2005)
- Reconocimiento automático de rostros para la recuperación de personajes de películas en largometrajes (Arandjelovic & Zisserman, 2005)
- Espacios de imagen significativos (Rouw, 2005)
- Recuperación de información multimedia basada en contenido: estado del arte y desafíos (Lew et al. 2006)
- Navegación adaptativa de bases de datos de imágenes con PIBE (Bartolini, Ciaccia y Patella, 2006)
- Algoritmo en el que se basan Retrievr (búsqueda de Flickr) e imgSeek (Jacobs, Finkelstein, Salesin)
- Imaginación: explotación del análisis de enlaces para una anotación de imágenes precisa (Bartolini y Ciaccia, 2007)
- Evaluación del uso de interfaces para la especificación de consultas visuales. (Hove, 2007)
- De los píxeles a los espacios semánticos: avances en la recuperación de imágenes basada en contenido (Vasconcelos, 2007)
- Recuperación de imágenes basada en contenido indexando subventanas aleatorias con árboles aleatorizados (Maree et al., 2007)
- Recuperación de imágenes: ideas, influencias y tendencias de la nueva era (Datta et al., 2008)
- Anotación computarizada en tiempo real de imágenes (Li y Wang, 2008)
- Problemas de procesamiento de consultas en bases de datos de imágenes basadas en regiones (Bartolini, Ciaccia y Patella, 2010)
- Shiatsu: etiquetado automático jerárquico basado en la semántica de videos por segmentación mediante cortes (Bartolini, Patella y Romani, 2010)
- Recuperación de video basada en similitudes eficiente y eficaz (Bartolini y Romani, 2010)
- Búsqueda y anotación de imágenes multidimensionales basadas en palabras clave (Bartolini y Ciaccia, 2010)
- La biblioteca de windsurf para la recuperación eficiente de datos jerárquicos multimedia (Bartolini, Patella y Stromei, 2011)
- " Pl @ ntNet: Identificación interactiva de plantas basada en datos de imágenes sociales " (Joly, Alexis et al.)
- " Recuperación de imágenes basada en contenido (Tyagi, V, 2017)
- Superimagen: empaquetado de imágenes de relevancia semántica para indexación y recuperación (Luo, Zhang, Huang, Gao, Tian, 2014)
- Indexación y búsqueda de 100 millones de imágenes con Map-Reduce (Moise, Shestakov, Gudmundsson y Amsaleg, 2013)
enlaces externos
- Alkhazraj, Huthaefa (9 de agosto de 2017). "estudio relativo a la imagen de base constante: una revisión" . Procesamiento de imágenes IET . IEEE (procesamiento de imágenes). ISSN 1751-9659 . Consultado el 22 de enero de 2019 . - el artículo original
- Artículos relacionados con CBIR de cbir.info
- IJMIR muchos artículos relacionados con CBIR
- Buscar por dibujo
- Demostración de un motor de búsqueda visual de imágenes. (Buscar por imagen o colores de ejemplo)