Sistema de recuperación de información SMART


El sistema de recuperación de información SMART (System for the Mechanical Analysis and Retrieval of Text) es un sistema de recuperación de información desarrollado en la Universidad de Cornell en la década de 1960. [1] Muchos conceptos importantes en la recuperación de información se desarrollaron como parte de la investigación del sistema SMART, incluido el modelo de espacio vectorial , la retroalimentación de relevancia y la clasificación de Rocchio .

El sistema SMART también proporciona un conjunto de corpus, consultas y rankings de referencia, extraídos de diferentes materias, entre las que destacan

Al legado del sistema SMART pertenece la llamada notación triple SMART, un esquema nemotécnico para denotar variantes de ponderación tf-idf en el modelo de espacio vectorial. El mnemotécnico para representar una combinación de ponderaciones toma la forma ddd.qqq, donde las tres primeras letras representan la ponderación del término del vector del documento de colección y las otras tres letras representan la ponderación del término para el vector del documento de consulta. Por ejemplo, ltc.lnnrepresenta la ltcponderación aplicada a un documento de colección y la lnnponderación aplicada a un documento de consulta.

Las letras grises en las columnas primera, quinta y novena son el esquema utilizado por Salton y Buckley en su artículo de 1988. [4] Las letras en negrita en las columnas segunda, sexta y décima son el esquema utilizado en los experimentos informados a partir de entonces.