RetrievalWare es un motor de búsqueda empresarial que enfatiza el procesamiento del lenguaje natural y las redes semánticas que estuvo disponible comercialmente desde 1992 hasta 2007 y es especialmente conocido por su uso por agencias gubernamentales de inteligencia. [1]
Desarrollador (es) | Búsqueda y transferencia rápida , Convera , Excalibur Technologies, ConQuest Software, Microsoft |
---|---|
Lanzamiento estable | 8.2 / 13 de octubre de 2006 |
Escrito en | C , C ++ , Java |
Sistema operativo | Multiplataforma |
Tipo | Búsqueda e índice |
Historia
RetrievalWare fue creado inicialmente por Paul Nelson, [2] Kenneth Clark, [3] y Edwin Addison [4] como parte de ConQuest Software. El desarrollo comenzó en 1989, pero el software no estuvo disponible comercialmente a gran escala hasta 1992. El Laboratorio de Roma proporcionó los primeros fondos a través de una subvención de Investigación en Innovación para Pequeñas Empresas . [5]
El 6 de julio de 1995, ConQuest Software se fusionó con la empresa NASDAQ, Excalibur Technologies [6] y el producto pasó a llamarse RetrievalWare. El 21 de diciembre de 2000, Excalibur Technologies se combinó con la división Interactive Media Services de Intel Corporation para formar Convera Corporation . [7] Finalmente, el 9 de abril de 2007, Fast Search & Transfer adquirió el software y el negocio RetrievalWare, momento en el que el producto se retiró oficialmente. [8] Microsoft Corporation continúa manteniendo el producto para su base de clientes existente.
Los ingresos anuales de RetrievalWare alcanzaron su punto máximo en 2001 en alrededor de $ 40 millones de dólares estadounidenses. [9]
Uso de técnicas de lenguaje natural
RetrievalWare es un sistema de búsqueda de texto de clasificación por relevancia con mejoras de procesamiento extraídas de los campos del procesamiento del lenguaje natural (NLP) y las redes semánticas . Los algoritmos de PNL incluyen la derivación basada en diccionario (también conocida como lematización ) y la identificación de frases basada en diccionario. Las redes semánticas son utilizadas por RetrievalWare para expandir las palabras de consulta ingresadas por el usuario a términos relacionados con pesos de términos determinados por la distancia de los términos originales del usuario. Además de la expansión automática, estaba disponible un modo de retroalimentación mediante el cual los usuarios podían elegir el significado de la palabra antes de realizar la expansión. Las primeras redes semánticas se construyeron utilizando WordNet .
Además, RetrievalWare implementó una forma de búsqueda de n-gramas (con la marca APRP - Adaptive Pattern Recognition Processing [10] ), diseñada para buscar documentos con errores de OCR . Los términos de consulta se dividen en conjuntos de 2 gramos que se utilizan para localizar términos coincidentes similares del índice invertido . Las coincidencias resultantes se ponderan en función de medidas similares y luego se utilizan para buscar documentos.
Todas estas características estaban disponibles a más tardar en 1993 [11] y el software ConQuest ha afirmado que fue el primer sistema comercial de búsqueda de texto en implementar estas técnicas. [12]
Otras características notables
Otras características notables de RetrievalWare incluyen servidores de búsqueda distribuidos, [11] sincronizadores para indexar sistemas de administración de contenido externos y bases de datos relacionales , [13] un modelo de seguridad heterogéneo, [13] categorización de documentos , [13] búsqueda de coincidencias entre documentos y consultas en tiempo real (elaboración de perfiles ), [11] búsquedas multilingües (consultas que contienen términos de varios idiomas en busca de documentos que contienen términos de varios idiomas) y búsquedas multilingües (consultas en un idioma que buscan documentos en otro idioma). [14]
Participación en TREC
RetrievalWare participó en la Text REtrieval Conference en 1992 (TREC-1), 1993 (TREC-2) y 1995 (TREC-4). [15]
En TREC-1 [16] y TREC-4, [17] las ejecuciones de RetrievalWare para consultas ingresadas manualmente produjeron los mejores resultados basados en los promedios de 11 puntos en todos los motores de búsqueda que participaron en la categoría ad hoc donde los motores de búsqueda tienen permitido un oportunidad única de procesar consultas previamente desconocidas en una base de datos existente.
Referencias
- ↑ Vise, David A. (3 de diciembre de 2004). "Las agencias encuentran lo que buscan" . The Washington Post . Consultado el 22 de mayo de 2010 .
- ^ "Paul Nelson, líder de innovación, análisis de contenido en Accenture Analytics" . Consultado el 1 de diciembre de 2020 .
- ^ "Arden y Ken" . comcast.net. 23 de julio de 2011. Archivado desde el original el 23 de julio de 2011 .
- ^ "Ed Addison, emprendedor en serie, capitalista de riesgo, ejecutivo de negocios, profesor" .
- ^ . John McGrath se incorporó a la empresa en 1993 como vicepresidente de ventas y marketing. La compañía aumentó rápidamente los ingresos de los contratos federales de EE. UU., Los editores y los clientes empresariales que requerían precisión y rendimiento avanzados en la recuperación de texto. SOLICITUD SBIR DEL AF 1991 - RESUMEN DEL PREMIO FASE I - PROYECTOS DE LA FUERZA AÉREA - VOLUMEN III (PDF) , 1992-07-06, págs. 70–71 - Tenga en cuenta que "Synchronetics" era el nombre original de ConQuest Software Incorporated.
- ^ "Excalibur Technologies se fusionará con ConQuest Software; los líderes en recuperación de información de texto y multimedia unen fuerzas para expandir productos, canales y mercados" (Comunicado de prensa). Business Wire. 1995-07-06.
- ^ "Intel y Excalibur forman Convera Corporation" . Silicon Valley / San José Business Journal. 2000-12-21.
- ^ "FAST adquiere el negocio de RetrievalWare de Convera" . Information Today, Inc. 2007-04-09.
Si bien FAST continuará admitiendo la plataforma RetrievalWare, no continuará desarrollándose en ella ni agregará nuevas funciones. A los clientes de RetrievalWare se les ofrecerá una ruta de actualización a la oferta propia de FAST.
- ^ Convera Corp · 10-K · Para 1/1/01 , 2001-01-01 - Indica que los productos Convera representaron el 85% de los ingresos totales de $ 51,5 millones.
- ^ Excalibur anuncia Excalibur RetrievalWare 6.5 con RetrievalWare FileRoom - Contiene una descripción de APRP
- ^ a b c Informe del sitio para la Conferencia de recuperación de texto de ConQuest Software Inc. (TREC2) - Encuentre los procedimientos completos aquí
- ^ "Homework Helper debuta en Prodigy usando el motor de búsqueda ConQuest" (Comunicado de prensa). Business Wire. 1995-02-09.
ConQuest es el único motor de búsqueda que utiliza diccionarios, tesauros y otros recursos léxicos para construir una base de conocimiento semántica de más de 440.000 significados de palabras y 1,6 millones de relaciones de palabras.
- ^ a b c "Excalibur RetrievalWare: más que recuperación de información" . KMWorld. 1999-10-01.
- ^ "Búsqueda, recuperación, categorización multimedia" . KMWorld. 2002-03-25.
- ^ Flank, Sharon (1998). "Un enfoque en capas para la recuperación de información basada en PNL" . Actas de la 36ª reunión anual de la Asociación de Lingüística Computacional - . 1 . dl.acm.org. pag. 397. doi : 10.3115 / 980845.980913 . Consultado el 1 de diciembre de 2020 .
- ^ Informe del sitio para la Conferencia de recuperación de texto por ConQuest Software Inc. (TREC-1) - Encuentre los procedimientos completos aquí
- ^ El sistema Excalibur TREC-4, preparaciones y resultados : se puede encontrar una versión en PDF aquí Archivado 2010-11-27 en Wayback Machine y los procedimientos completos se pueden encontrar aquí
enlaces externos
- Presentación de marketing sobre redes semánticas RetrievalWare y algoritmos de reconocimiento de patrones adaptativos