La recuperación de información geográfica (GIR) o los sistemas de recuperación de información geográfica son herramientas de búsqueda para buscar en la Web , documentos empresariales y búsqueda local móvil que combinan consultas tradicionales basadas en texto con consultas de ubicación, como un mapa o nombres de lugares . Al igual que los sistemas tradicionales de recuperación de información , los sistemas GIR indexan texto e información de documentos estructurados y no estructurados , y también aumentan esos índices con información geográfica.. El desarrollo y la ingeniería de los sistemas GIR apunta a construir sistemas que puedan responder de manera confiable a consultas que incluyan una dimensión geográfica, como "¿Qué guerras se libraron en Grecia?" o "restaurantes en Beirut". [1] La similitud semántica y la desambiguación del sentido de las palabras son componentes importantes de GIR. [2] Para identificar nombres de lugares, los sistemas GIR a menudo se basan en el procesamiento del lenguaje natural [3] u otros metadatos para asociar documentos de texto con ubicaciones. Estas herramientas de georreferenciación , geoetiquetado y geoanálisis a menudo necesitan bases de datos de nombres de ubicación, conocidas como nomenclátores . [4] [5] [6] [7]
Arquitectura GIR
GIR implica extraer y resolver el significado de ubicaciones en texto no estructurado. Esto se conoce como análisis geográfico . [5] Después de identificar las menciones de lugares y ubicaciones en el texto, un sistema GIR indexa esta información para su búsqueda y recuperación. Los sistemas GIR comúnmente se pueden dividir en las siguientes etapas: análisis geográfico, indexación geográfica y de texto, almacenamiento de datos, clasificación de relevancia geográfica con respecto a una consulta geográfica y resultados de navegación comúnmente con una interfaz de mapa.
Algunos sistemas GIR separan la indexación de texto de la indexación geográfica, lo que permite el uso de combinaciones de bases de datos genéricas , [8] o filtrado de múltiples etapas, [9] y otros los combinan para mayor eficiencia. [10]
GIR debe gestionar varias formas de incertidumbre, incluida la ambigüedad semántica de las menciones de lugares en el texto en lenguaje natural y la precisión de la posición. [11]
Sistemas GIR
Estudio y evaluación
El estudio de los sistemas GIR tiene una rica historia que se remonta a la década de 1970 y posiblemente antes. Véase el libro de Ray Larson Recuperación de información geográfica y navegación espacial [20] para obtener referencias a gran parte de la literatura anterior a la Web sobre RIG.
En 2005, el Foro de evaluación de idiomas cruzados agregó una pista geográfica, GeoCLEF. GeoCLEF fue el primer foro de evaluación estilo TREC para sistemas GIR y brindó a los participantes la oportunidad de comparar sistemas. [21]
Aplicaciones
GIR tiene muchas aplicaciones en geoweb , neogeografía y búsqueda local móvil y ha sido el foco de muchas conferencias, incluidas las conferencias de usuarios de ESRI y las conferencias Where 2.0 de O'Reilly . [22] [23]
Referencias
- ^ Purves, Ross; Jones, Christopher (1 de julio de 2011). "Recuperación de información geográfica". Especial SIGSPATIAL . 3 (2): 2–4. CiteSeerX 10.1.1.130.3521 . doi : 10.1145 / 2047296.2047297 . ISSN 1946-7729 . S2CID 1940653 .
- ^ Kuhn, Werner; Raubal, Martin; Janowicz, Krzysztof (25 de mayo de 2011). "La semántica de la similitud en la recuperación de información geográfica | Janowicz | Revista de ciencia de la información espacial" . Revista de ciencia de la información espacial . 2011 (2): 29–57. doi : 10.5311 / JOSIS.2011.2.26 (inactivo el 31 de mayo de 2021) . Consultado el 12 de septiembre de 2015 .Mantenimiento de CS1: DOI inactivo a partir de mayo de 2021 ( enlace )
- ^ "MetaCarta: poner el lenguaje natural en el mapa" . Monitor GIS. 2003-08-21. Archivado desde el original el 3 de octubre de 2003.
- ^ Smith, Susan. "El espacio entre mapas, búsqueda y contenido" .
- ^ a b Dinan, Elizabeth (10 de noviembre de 2003). "Ware-Withal: MetaCarta arraigada en el MIT hace su reclamo con el software de geoanálisis automático" .
- ^ "MetaCarta presenta la primera solución de georreferenciación para admitir los idiomas árabe y español" . 2007-06-20.
- ^ Frank, John; Warren, Bob. "Ubicación de todo el contenido" (PDF) .
- ^ "Capítulo 15. Ajuste de rendimiento de consultas". PostGIS en acción (Segunda ed.). Publicaciones Manning.
- ^ "Apache Solr - Guía de referencia de Lucene - Búsqueda espacial" . Consultado el 3 de enero de 2021 .
- ^ "Índice de texto de búsqueda de mapas de CartaTrees" . Archivado desde el original el 2 de abril de 2004.
- ^ Bordognaa, Gloria; Ghisalbertib, Giorgio; Psailac, Giuseppe (1 de junio de 2012). "Recuperación de información geográfica: modelado de la incertidumbre del contexto del usuario". Conjuntos y sistemas difusos . 196 : 105-124. doi : 10.1016 / j.fss.2011.04.005 .
La recuperación de información geográfica (GIR) es hoy en día un tema de investigación candente que involucra la gestión de la incertidumbre y la imprecisión y el modelado de las preferencias y el contexto del usuario. Indexar el contenido geográfico de los documentos implica lidiar con la ambigüedad, sinonimia y homonimia de los nombres geográficos en los textos. Por otro lado, la evaluación de consultas que especifican tanto las condiciones basadas en el contenido como las condiciones espaciales en el contenido de los documentos requiere representar la vaguedad y la dependencia del contexto de las condiciones espaciales y las preferencias personales del usuario.
- ^ Jennifer 8. Lee (14 de enero de 2002). "Los agentes federales buscan adaptar la tecnología privada" . New York Times .
- ^ "La venganza de la geografía" . The Economist . 2003-03-13. Archivado desde el original el 31 de diciembre de 2020.
- ^ Levy, Steven (7 de junio de 2004). "Hacer el mapa definitivo: cuando la geografía digital se une a la tecnología inalámbrica y la Web, el mundo adquiere nuevas dimensiones" . Newsweek . Archivado desde el original el 3 de junio de 2004.
- ^ US concedió 7117199 , Frank, John R .; Erik M. Rauch & Karen Donoghue, "Codificación espacial y visualización de información", publicado el 3 de octubre de 2006
- ^ Erik Rauch , Michael Bukatin y Kenneth Baker de MetaCarta . Un marco basado en la confianza para eliminar la ambigüedad de términos geográficos (habla) . Consultado el 3 de enero de 2021 .Mantenimiento de CS1: utiliza el parámetro de autores ( enlace )
- ^ András Kornai , MetaCarta (2005). MetaCarta en GeoCLEF 2005 . GeoCLEF.
In Memoriam Erik Rauch
- ^ Adams, Benjamin; McKenzie, Grant; Gahegan, Mark (1 de enero de 2015). Frankenplace: Mapeo temático interactivo para búsquedas exploratorias ad hoc . Actas de la 24ª Conferencia Internacional sobre World Wide Web . WWW '15. República y Cantón de Ginebra, Suiza: Comité Directivo de las Conferencias Internacionales de la World Wide Web. págs. 12-22. doi : 10.1145 / 2736277.2741137 . ISBN 978-1-4503-3469-3. S2CID 1639723 .
- ^ Amitay, Einat; Har'El, Nadav; Sivan, Ron; Soffer, Aya (julio de 2004). Web-a-where: geoetiquetado de contenido web . SIGIR '04: Actas de la 27ª conferencia internacional anual ACM SIGIR sobre investigación y desarrollo en la recuperación de información. págs. 273–280. doi : 10.1145 / 1008992.1009040 .
Describimos Web-a-Where, un sistema para asociar la geografía con las páginas web. Web-a-Where ubica las menciones de lugares y determina el lugar al que se refiere cada nombre. Además, asigna a cada página un enfoque geográfico, una localidad que la página analiza en su conjunto.
- ^ Larson, Ray R. (1996). Recuperación de información geográfica y navegación espacial . Escuela de Graduados en Bibliotecología y Ciencias de la Información, Universidad de Illinois en Urbana-Champaign. hdl : 2142/416 . ISBN 0878450971. ISSN 0069-4789 .
- ^ Gey, Fredric; Larson, Ray; Sanderson, Mark; Joho, Hideo; Clough, Paul; Petras, Vivien (21 de septiembre de 2005). Peters, Carol; Gey, Fredric C .; Gonzalo, Julio; Müller, Henning; Jones, Gareth JF; Kluck, Michael; Magnini, Bernardo; Rijke, Maarten de (eds.). GeoCLEF: Descripción general de la pista de recuperación de información geográfica entre idiomas de CLEF 2005 . Apuntes de conferencias en Ciencias de la Computación. Springer Berlín Heidelberg. págs. 908–919. CiteSeerX 10.1.1.156.6368 . doi : 10.1007 / 11878773_101 . ISBN 978-3-540-45697-1.
- ^ La búsqueda local se enfrenta a lo contrario: Craig Donato, Perry Evans, John Frank, Jeremy Kreitler, Shailesh Rao (discurso). Donde 2.0. 2005-06-29. Archivado desde el original el 29 de julio de 2013.
- ^ Himmelstein, Marty (2005). "Búsqueda local: Internet son las páginas amarillas" . Computadora . Publicado por la IEEE Computer Society. 38 (2): 26–34. doi : 10.1109 / MC.2005.65 .
Todos los días, millones de personas utilizan sus periódicos locales, circulares de anuncios clasificados, directorios de páginas amarillas, revistas regionales e Internet para encontrar información relacionada con las actividades de la vida diaria ...
Ver también
- Sistema de información geográfica
- Geoparsing
- Recuperación de información
- MetaCarta
- Similitud semántica
- Motor de búsqueda (informática)
- Toponimia