De Wikipedia, la enciclopedia libre
Ir a navegaciónSaltar a buscar

VisualRank es un sistema para buscar y clasificar imágenes analizando y comparando su contenido, en lugar de buscar nombres de imágenes, enlaces web u otro texto. Los científicos de Google hicieron público su trabajo de VisualRank en un documento que describe la aplicación de PageRank a la búsqueda de imágenes de Google en la Conferencia Internacional World Wide Web en Beijing en 2008. [1]

Métodos

Ambos de visión por ordenador técnicas y hashing localidad sensible (LSH) se utilizan en la VisualRank algoritmo . Considere una búsqueda de imágenes iniciada por una consulta de texto. Se utiliza una técnica de búsqueda existente basada en metadatos de imágenes y texto circundante para recuperar los candidatos de resultado inicial ( PageRank ), que junto con otras imágenes en el índice se agrupan en un gráfico de acuerdo con su similitud (que se calcula previamente). Centralidadluego se mide en el agrupamiento, que devolverá la (s) imagen (es) más canónica con respecto a la consulta. La idea aquí es que el acuerdo entre los usuarios de la web sobre la imagen y sus conceptos relacionados dará como resultado que esas imágenes se consideren más similares. VisualRank se define iterativamente por, donde es la matriz de similitud de imágenes. A medida que se utilizan matrices, la centralidad del vector propio será la medida aplicada, con multiplicación repetida de y produciendo el vector propio que estamos buscando. Claramente, la medida de similitud de imágenes es crucial para el rendimiento de VisualRank, ya que determina la estructura del gráfico subyacente.

El sistema principal de VisualRank comienza con la extracción de vectores de características locales de las imágenes mediante la transformación de características invariantes de escala (SIFT). Se utilizan descriptores de características locales en lugar de histogramas de color, ya que permiten considerar la similitud entre imágenes con posibles transformaciones de rotación, escala y perspectiva. Luego, se aplica hash sensible a la localidad a estos vectores de características utilizando el esquema de distribución p-estable . Además de esto, se aplica la amplificación LSH usando construcciones AND / OR. Como parte del esquema aplicado, se utiliza una distribución gaussiana bajo lanorma .

Referencias

  1. ^ Yushi Jing y Baluja, S. (2008). "VisualRank: aplicación de PageRank a la búsqueda de imágenes a gran escala". Transacciones IEEE sobre análisis de patrones e inteligencia de máquinas . 30 (11): 1877–1890. CiteSeerX 10.1.1.309.741 . doi : 10.1109 / TPAMI.2008.121 . ISSN 0162-8828 . PMID 18787237 .   .

Enlaces externos