La recuperación de información entre humanos y computadoras ( HCIR ) es el estudio y la ingeniería de técnicas de recuperación de información que incorporan la inteligencia humana al proceso de búsqueda . Combina los campos de interacción humano-computadora (HCI) y recuperación de información (IR) y crea sistemas que mejoran la búsqueda teniendo en cuenta el contexto humano, o mediante un proceso de búsqueda de varios pasos que brinda la oportunidad de retroalimentación humana.
Gary Marchionini acuñó este término recuperación de información entre humanos y computadoras en una serie de conferencias dictadas entre 2004 y 2006. [1] La tesis principal de Marchionini es que "HCIR tiene como objetivo capacitar a las personas para explorar bases de información a gran escala, pero exige que las personas también tomen responsabilidad de este control gastando energía cognitiva y física ".
En 1996 y 1998, un par de talleres en la Universidad de Glasgow sobre recuperación de información e interacción humano-computadora buscaron abordar la superposición entre estos dos campos. Marchionini señala el impacto de la World Wide Web y el aumento repentino de la alfabetización en información , cambios que fueron embrionarios a fines de la década de 1990.
Algunos talleres se han centrado en la intersección de IR y HCI. El Taller sobre Búsqueda Exploratoria, iniciado por el Laboratorio de Interacción Hombre-Computadora de la Universidad de Maryland en 2005, alterna entre las conferencias del Grupo de Interés Especial sobre Recuperación de Información (SIGIR) de la Asociación de Maquinaria de Computación y el Grupo de Interés Especial sobre Interacción Humano-Computadora (CHI). También en 2005, la European Science Foundation organizó un taller exploratorio sobre recuperación de información en contexto. Luego, el primer Taller sobre Recuperación de Información por Computadora Humana se llevó a cabo en 2007 en el Instituto de Tecnología de Massachusetts .
HCIR incluye varios aspectos de IR y HCI. Estos incluyen la búsqueda exploratoria , en la que los usuarios generalmente combinan estrategias de consulta y navegación para fomentar el aprendizaje y la investigación; recuperación de información en contexto (es decir, teniendo en cuenta aspectos del usuario o del entorno que normalmente no se reflejan en una consulta); y recuperación de información interactiva, que Peter Ingwersen define como "los procesos de comunicación interactiva que ocurren durante la recuperación de información al involucrar a todos los participantes principales en la recuperación de información (RI), es decir, el usuario, el intermediario y el sistema de RI". [2]
Una preocupación clave de HCIR es que los sistemas de IR destinados a usuarios humanos se implementen y evalúen de una manera que refleje las necesidades de esos usuarios. [3]
La mayoría de los sistemas de infrarrojos modernos emplean un modelo de recuperación clasificado , en el que los documentos se califican en función de la probabilidad de que el documento sea relevante para la consulta. [4] En este modelo, el sistema solo presenta al usuario los documentos mejor clasificados. Estos sistemas generalmente se evalúan en función de su precisión promedio promedio sobre un conjunto de consultas de referencia de organizaciones como Text Retrieval Conference (TREC).
Debido a su énfasis en el uso de la inteligencia humana en el proceso de recuperación de información, HCIR requiere diferentes modelos de evaluación, uno que combine la evaluación de los componentes IR y HCI del sistema. Un área clave de investigación en HCIR implica la evaluación de estos sistemas. Los primeros trabajos sobre recuperación de información interactiva, como el estudio de 1996 de Juergen Koenemann y Nicholas J. Belkin sobre diferentes niveles de interacción para la reformulación automática de consultas, aprovechan las medidas estándar de IR de precisión y recuperación, pero las aplican a los resultados de múltiples iteraciones de usuarios. interacción, en lugar de una única respuesta a la consulta. [5]Otras investigaciones del HCIR, como el modelo de evaluación IIR de Pia Borlund, aplica una metodología que recuerda más al HCI, centrándose en las características de los usuarios, los detalles del diseño experimental, etc. [6]
Los investigadores de HCIR han propuesto los siguientes objetivos hacia un sistema en el que el usuario tenga más control para determinar los resultados relevantes. [1] [7]
Los sistemas deben
En resumen, se espera que los sistemas de recuperación de información funcionen como lo hacen las buenas bibliotecas. Los sistemas deben ayudar a los usuarios a cerrar la brecha entre los datos o la información (en el sentido muy estrecho y granular de estos términos) y el conocimiento (datos procesados o información que proporciona el contexto necesario para informar la próxima iteración de un proceso de búsqueda de información). Es decir, las buenas bibliotecas brindan tanto la información que un usuario necesita como un socio en el proceso de aprendizaje, el profesional de la información , para navegar esa información, darle sentido, preservarla y convertirla en conocimiento (que a su vez crea nuevos conocimientos). , necesidades de información más informadas).
Las técnicas asociadas con HCIR enfatizan las representaciones de información que utilizan la inteligencia humana para llevar al usuario a resultados relevantes. Estas técnicas también se esfuerzan por permitir a los usuarios explorar y digerir el conjunto de datos sin penalización, es decir, sin gastar costos innecesarios de tiempo, clics del mouse o cambios de contexto.
Muchos motores de búsqueda tienen funciones que incorporan técnicas HCIR. Las sugerencias ortográficas y la reformulación automática de consultas proporcionan mecanismos para sugerir posibles rutas de búsqueda que pueden llevar al usuario a resultados relevantes. Estas sugerencias se presentan al usuario, poniendo el control de la selección y la interpretación en manos del usuario.
La búsqueda por facetas permite a los usuarios navegar por la información jerárquicamente , pasando de una categoría a sus subcategorías, pero eligiendo el orden en el que se presentan las categorías. Esto contrasta con las taxonomías tradicionales en las que la jerarquía de categorías es fija e invariable. La navegación por facetas , como la navegación taxonómica, guía a los usuarios mostrándoles categorías (o facetas) disponibles, pero no les obliga a navegar a través de una jerarquía que no se adapte precisamente a sus necesidades o forma de pensar. [8]
Lookahead proporciona un enfoque general para la exploración sin penalizaciones. Por ejemplo, varias aplicaciones web emplean AJAX para completar automáticamente términos de consulta y sugerir búsquedas populares. Otro ejemplo común de búsqueda anticipada es la forma en que los motores de búsqueda anotan los resultados con información resumida sobre esos resultados, incluida información estática (p. Ej., Metadatos sobre los objetos) y "fragmentos" del texto del documento que son más pertinentes para las palabras de la búsqueda. consulta.
La retroalimentación de relevancia permite a los usuarios guiar un sistema de RI indicando si los resultados particulares son más o menos relevantes. [9]
El resumen y el análisis ayudan a los usuarios a asimilar los resultados que se obtienen de la consulta. El resumen aquí pretende abarcar cualquier medio de agregar o comprimir los resultados de la consulta en una forma más consumible por humanos. La búsqueda por facetas, descrita anteriormente, es una de esas formas de resumen. Otro es el agrupamiento , que analiza un conjunto de documentos agrupando documentos o términos similares o coexistentes. La agrupación en clústeres permite dividir los resultados en grupos de documentos relacionados. Por ejemplo, una búsqueda de "java" puede devolver clústeres para Java (lenguaje de programación) , Java (isla) o Java (café) .
La representación visual de los datos también se considera un aspecto clave del HCIR. La representación de resumen o análisis puede mostrarse como tablas, gráficos o resúmenes de datos agregados. Otros tipos de visualización de información que permiten a los usuarios acceder a vistas resumidas de los resultados de búsqueda incluyen nubes de etiquetas y mapas de árboles .