Un motor de búsqueda vertical se distingue de un motor de búsqueda web general , ya que se centra en un segmento específico de contenido en línea. También se denominan motores de búsqueda especializados o temáticos. El área de contenido vertical puede basarse en la actualidad, el tipo de medio o el género del contenido. Los verticales comunes incluyen compras, industria automotriz, información legal, información médica, literatura académica, búsqueda de trabajo y viajes. Ejemplos de motores de búsqueda verticales incluyen la Biblioteca del Congreso , Mocavo , Nuroa , Trulia y Yelp .
A diferencia de los motores de búsqueda web generales, que intentan indexar grandes porciones de la World Wide Web utilizando un rastreador web , los motores de búsqueda verticales suelen utilizar un rastreador enfocado que intenta indexar solo las páginas web relevantes a un tema o conjunto de temas predefinidos. . Algunos sitios de búsqueda vertical se enfocan en verticales individuales, mientras que otros sitios incluyen múltiples búsquedas verticales dentro de un motor de búsqueda.
Beneficios
La búsqueda vertical ofrece varios beneficios potenciales sobre los motores de búsqueda generales:
- Mayor precisión debido al alcance limitado,
- Aprovechar el conocimiento del dominio, incluidas las taxonomías y ontologías ,
- Soporte de tareas específicas de usuarios únicos.
La búsqueda vertical se puede considerar similar a la búsqueda empresarial donde el dominio de enfoque es la empresa, como una empresa, gobierno u otra organización. En 2013, los sitios web de comparación de precios al consumidor con motores de búsqueda verticales integrados como FindTheBest atrajeron grandes rondas de financiación de capital de riesgo, lo que indica una tendencia de crecimiento para estas aplicaciones de tecnología de búsqueda vertical. [1] [2]
Búsqueda específica de dominio
Los verticales de dominios específicos se centran en un tema específico. John Battelle describe esto en su libro The Search (2005):
Las soluciones de búsqueda específicas de dominio se enfocan en un área de conocimiento, creando experiencias de búsqueda personalizadas, que debido al corpus limitado del dominio y las relaciones claras entre conceptos, brindan resultados extremadamente relevantes para los buscadores. [3]
Cualquier motor de búsqueda general estaría indexando todas las páginas y búsquedas de una manera amplia para recopilar documentos. El spidering en los motores de búsqueda de dominios específicos busca de manera más eficiente un pequeño subconjunto de documentos al enfocarse en un conjunto particular. Se ha descubierto que el uso de arañas con un marco de aprendizaje reforzado es tres veces más eficiente que la búsqueda en amplitud . [4]
Programa Memex de DARPA
A principios de 2014, la Agencia de Proyectos de Investigación Avanzada de Defensa ( DARPA ) publicó una declaración en su sitio web que describe los detalles preliminares del "programa Memex", que tiene como objetivo desarrollar nuevas tecnologías de búsqueda que superen algunas limitaciones de la búsqueda basada en texto. [5] DARPA quiere que la tecnología Memex desarrollada en esta investigación sea utilizable para motores de búsqueda que pueden buscar información en la Deep Web , la parte de Internet a la que los motores de búsqueda comerciales como Google o Yahoo no pueden acceder en gran medida . El sitio web de DARPA describe que "el objetivo es inventar mejores métodos para interactuar y compartir información, de modo que los usuarios puedan organizar y buscar de forma rápida y completa subconjuntos de información relevante para sus intereses individuales". [6] Como se informó en un artículo de Wired de 2015 , la tecnología de búsqueda que se está desarrollando en el programa Memex "tiene como objetivo arrojar luz sobre la web oscura y descubrir patrones y relaciones en los datos en línea para ayudar a la policía y otros a rastrear actividades ilegales". [7] DARPA tiene la intención de que el programa reemplace los procedimientos centralizados utilizados por los motores de búsqueda comerciales, afirmando que "la creación de un nuevo paradigma de búsqueda e indexación de dominios específicos proporcionará mecanismos para mejorar el descubrimiento de contenido, la extracción de información, la recuperación de información y la colaboración del usuario y extensión de las capacidades de búsqueda actuales a la deep web, la dark web y el contenido no tradicional (por ejemplo, multimedia) ". [8] En su descripción del programa, DARPA explica el nombre del programa como un tributo al invento Memex original de Bush, que sirvió de inspiración. [5]
En abril de 2015, se anunció que partes de Memex serían de código abierto. [9] Los módulos estaban disponibles para su descarga. [8]
Referencias
- ^ Rao, Leena. "La plataforma de comparación de compras basada en datos FindTheBest recauda $ 11 millones de New World, Kleiner Perkins y otros" . TechCrunch . Consultado el 27 de mayo de 2013 .
- ^ HO, VICTORIA. "El sitio asiático de comparación de precios Save 22 obtiene una ronda de ángel de" Mid Six Figures " " . Consultado el 27 de mayo de 2013 .
- ^ Battelle, John (2005). La búsqueda: cómo Google y sus rivales reescribieron las reglas del negocio y transformaron nuestra cultura . Nueva York: Portfolio.
- ^ McCallum, Andrew (1999). "Un enfoque de aprendizaje automático para la construcción de motores de búsqueda de dominios específicos". IJCAI . 99 : 662–667. CiteSeerX 10.1.1.88.3818 .
- ^ a b "Memex tiene como objetivo crear un nuevo paradigma para la búsqueda de dominios específicos" (Comunicado de prensa). DARPA . 9 de febrero de 2014. Archivado desde el original el 11 de febrero de 2015 . Consultado el 11 de febrero de 2015 .
- ^ "Memex (búsqueda específica de dominio)" . www.darpa.mil . Consultado el 21 de septiembre de 2016 .
- ^ Kim Zetter (2 de febrero de 2015). "Darpa está desarrollando un motor de búsqueda para la Dark Web" . Cableado .
- ^ a b "Memex (búsqueda específica de dominio)" . DARPA. Archivado desde el original el 10 de junio de 2015 . Consultado el 20 de abril de 2015 .
- ^ Forbes (17 de abril de 2015). "Cuidado con Google, DARPA acaba de abrir toda esta tecnología de búsqueda Swish 'Dark Web'" . Consultado el 20 de abril de 2015 .