Recuperación de información


La recuperación de información ( RI ) en la informática y la ciencia de la información es el proceso de obtener recursos del sistema de información que son relevantes para una necesidad de información a partir de una colección de esos recursos. Las búsquedas pueden basarse en el texto completo o en otra indexación basada en contenido. La recuperación de información es la ciencia de buscar información en un documento, buscar los propios documentos y también buscar los metadatos que describen los datos y las bases de datos de textos, imágenes o sonidos.

Los sistemas automatizados de recuperación de información se utilizan para reducir lo que se ha denominado sobrecarga de información . Un sistema de IR es un sistema de software que proporciona acceso a libros, revistas y otros documentos; almacena y gestiona esos documentos. Los motores de búsqueda web son las aplicaciones de infrarrojos más visibles.

Un proceso de recuperación de información comienza cuando un usuario ingresa una consulta en el sistema. Las consultas son declaraciones formales de necesidades de información, por ejemplo, cadenas de búsqueda en motores de búsqueda web. En la recuperación de información, una consulta no identifica de manera única un solo objeto en la colección. En cambio, varios objetos pueden coincidir con la consulta, quizás con diferentes grados de relevancia .

Un objeto es una entidad que está representada por información en una colección de contenido o base de datos . Las consultas de los usuarios se comparan con la información de la base de datos. Sin embargo, a diferencia de las consultas SQL clásicas de una base de datos, en la recuperación de información, los resultados devueltos pueden coincidir o no con la consulta, por lo que los resultados generalmente se clasifican. Esta clasificación de resultados es una diferencia clave de la búsqueda de recuperación de información en comparación con la búsqueda en la base de datos. [1]

Dependiendo de la aplicación , los objetos de datos pueden ser, por ejemplo, documentos de texto, imágenes, [2] audio, [3] mapas mentales [4] o videos. A menudo, los documentos en sí mismos no se guardan o almacenan directamente en el sistema de IR, sino que se representan en el sistema mediante sustitutos de documentos o metadatos .

La mayoría de los sistemas de infrarrojos calculan una puntuación numérica sobre qué tan bien coincide cada objeto de la base de datos con la consulta y clasifican los objetos de acuerdo con este valor. A continuación, se muestran al usuario los objetos de clasificación superior. Luego, el proceso puede repetirse si el usuario desea refinar la consulta. [5]


Categorización de modelos IR (traducido de la entrada alemana , fuente original Dominik Kuropka ).