Recuperación de información entre humanos y computadoras

La recuperación de información entre humanos y computadoras ( HCIR ) es el estudio y la ingeniería de técnicas de recuperación de información que incorporan la inteligencia humana al proceso de búsqueda . Combina los campos de interacción humano-computadora (HCI) y recuperación de información (IR) y crea sistemas que mejoran la búsqueda teniendo en cuenta el contexto humano, o mediante un proceso de búsqueda de varios pasos que brinda la oportunidad de retroalimentación humana.

Historia

Gary Marchionini acuñó este término recuperación de información entre humanos y computadoras en una serie de conferencias dictadas entre 2004 y 2006. ^[1] La tesis principal de Marchionini es que "HCIR tiene como objetivo capacitar a las personas para explorar bases de información a gran escala, pero exige que las personas también tomen responsabilidad de este control gastando energía cognitiva y física ".

En 1996 y 1998, un par de talleres en la Universidad de Glasgow sobre recuperación de información e interacción humano-computadora buscaron abordar la superposición entre estos dos campos. Marchionini señala el impacto de la World Wide Web y el aumento repentino de la alfabetización en información , cambios que fueron embrionarios a fines de la década de 1990.

Algunos talleres se han centrado en la intersección de IR y HCI. El Taller sobre Búsqueda Exploratoria, iniciado por el Laboratorio de Interacción Hombre-Computadora de la Universidad de Maryland en 2005, alterna entre las conferencias del Grupo de Interés Especial sobre Recuperación de Información (SIGIR) de la Asociación de Maquinaria de Computación y el Grupo de Interés Especial sobre Interacción Humano-Computadora (CHI). También en 2005, la European Science Foundation organizó un taller exploratorio sobre recuperación de información en contexto. Luego, el primer Taller sobre Recuperación de Información por Computadora Humana se llevó a cabo en 2007 en el Instituto de Tecnología de Massachusetts .

Descripción

HCIR incluye varios aspectos de IR y HCI. Estos incluyen la búsqueda exploratoria , en la que los usuarios generalmente combinan estrategias de consulta y navegación para fomentar el aprendizaje y la investigación; recuperación de información en contexto (es decir, teniendo en cuenta aspectos del usuario o del entorno que normalmente no se reflejan en una consulta); y recuperación de información interactiva, que Peter Ingwersen define como "los procesos de comunicación interactiva que ocurren durante la recuperación de información al involucrar a todos los participantes principales en la recuperación de información (RI), es decir, el usuario, el intermediario y el sistema de RI". ^[2]

Una preocupación clave de HCIR es que los sistemas de IR destinados a usuarios humanos se implementen y evalúen de una manera que refleje las necesidades de esos usuarios. ^[3]

La mayoría de los sistemas de infrarrojos modernos emplean un modelo de recuperación clasificado , en el que los documentos se califican en función de la probabilidad de que el documento sea relevante para la consulta. ^[4] En este modelo, el sistema solo presenta al usuario los documentos mejor clasificados. Estos sistemas generalmente se evalúan en función de su precisión promedio promedio sobre un conjunto de consultas de referencia de organizaciones como Text Retrieval Conference (TREC).

Debido a su énfasis en el uso de la inteligencia humana en el proceso de recuperación de información, HCIR requiere diferentes modelos de evaluación, uno que combine la evaluación de los componentes IR y HCI del sistema. Un área clave de investigación en HCIR implica la evaluación de estos sistemas. Los primeros trabajos sobre recuperación de información interactiva, como el estudio de 1996 de Juergen Koenemann y Nicholas J. Belkin sobre diferentes niveles de interacción para la reformulación automática de consultas, aprovechan las medidas estándar de IR de precisión y recuperación, pero las aplican a los resultados de múltiples iteraciones de usuarios. interacción, en lugar de una única respuesta a la consulta. ^[5]Otras investigaciones del HCIR, como el modelo de evaluación IIR de Pia Borlund, aplica una metodología que recuerda más al HCI, centrándose en las características de los usuarios, los detalles del diseño experimental, etc. ^[6]

Metas

Los investigadores de HCIR han propuesto los siguientes objetivos hacia un sistema en el que el usuario tenga más control para determinar los resultados relevantes. ^[1]^[7]

Los sistemas deben

ya no solo entregar los documentos relevantes, sino que también debe proporcionar información semántica junto con esos documentos
aumentar la responsabilidad y el control del usuario; es decir, los sistemas de información requieren un esfuerzo intelectual humano
tienen arquitecturas flexibles para que puedan evolucionar y adaptarse a bases de usuarios cada vez más exigentes y conocedores
tienen como objetivo ser parte de la ecología de la información de las memorias y herramientas personales y compartidas en lugar de servicios independientes discretos
Apoyar todo el ciclo de vida de la información (desde la creación hasta la preservación) en lugar de solo la fase de difusión o uso.
Apoyar el ajuste por parte de los usuarios finales y especialmente por los profesionales de la información que agregan valor a los recursos de información.
ser atractivo y divertido de usar

En resumen, se espera que los sistemas de recuperación de información funcionen como lo hacen las buenas bibliotecas. Los sistemas deben ayudar a los usuarios a cerrar la brecha entre los datos o la información (en el sentido muy estrecho y granular de estos términos) y el conocimiento (datos procesados o información que proporciona el contexto necesario para informar la próxima iteración de un proceso de búsqueda de información). Es decir, las buenas bibliotecas brindan tanto la información que un usuario necesita como un socio en el proceso de aprendizaje, el profesional de la información , para navegar esa información, darle sentido, preservarla y convertirla en conocimiento (que a su vez crea nuevos conocimientos). , necesidades de información más informadas).

Técnicas

Las técnicas asociadas con HCIR enfatizan las representaciones de información que utilizan la inteligencia humana para llevar al usuario a resultados relevantes. Estas técnicas también se esfuerzan por permitir a los usuarios explorar y digerir el conjunto de datos sin penalización, es decir, sin gastar costos innecesarios de tiempo, clics del mouse o cambios de contexto.

Muchos motores de búsqueda tienen funciones que incorporan técnicas HCIR. Las sugerencias ortográficas y la reformulación automática de consultas proporcionan mecanismos para sugerir posibles rutas de búsqueda que pueden llevar al usuario a resultados relevantes. Estas sugerencias se presentan al usuario, poniendo el control de la selección y la interpretación en manos del usuario.

La búsqueda por facetas permite a los usuarios navegar por la información jerárquicamente , pasando de una categoría a sus subcategorías, pero eligiendo el orden en el que se presentan las categorías. Esto contrasta con las taxonomías tradicionales en las que la jerarquía de categorías es fija e invariable. La navegación por facetas , como la navegación taxonómica, guía a los usuarios mostrándoles categorías (o facetas) disponibles, pero no les obliga a navegar a través de una jerarquía que no se adapte precisamente a sus necesidades o forma de pensar. ^[8]

Lookahead proporciona un enfoque general para la exploración sin penalizaciones. Por ejemplo, varias aplicaciones web emplean AJAX para completar automáticamente términos de consulta y sugerir búsquedas populares. Otro ejemplo común de búsqueda anticipada es la forma en que los motores de búsqueda anotan los resultados con información resumida sobre esos resultados, incluida información estática (p. Ej., Metadatos sobre los objetos) y "fragmentos" del texto del documento que son más pertinentes para las palabras de la búsqueda. consulta.

La retroalimentación de relevancia permite a los usuarios guiar un sistema de RI indicando si los resultados particulares son más o menos relevantes. ^[9]

El resumen y el análisis ayudan a los usuarios a asimilar los resultados que se obtienen de la consulta. El resumen aquí pretende abarcar cualquier medio de agregar o comprimir los resultados de la consulta en una forma más consumible por humanos. La búsqueda por facetas, descrita anteriormente, es una de esas formas de resumen. Otro es el agrupamiento , que analiza un conjunto de documentos agrupando documentos o términos similares o coexistentes. La agrupación en clústeres permite dividir los resultados en grupos de documentos relacionados. Por ejemplo, una búsqueda de "java" puede devolver clústeres para Java (lenguaje de programación) , Java (isla) o Java (café) .

La representación visual de los datos también se considera un aspecto clave del HCIR. La representación de resumen o análisis puede mostrarse como tablas, gráficos o resúmenes de datos agregados. Otros tipos de visualización de información que permiten a los usuarios acceder a vistas resumidas de los resultados de búsqueda incluyen nubes de etiquetas y mapas de árboles .

Áreas relacionadas

Búsqueda exploratoria de videos
Búsqueda de información

Referencias

↑ a b Marchionini, G. (2006). Toward Human-Computer Information Retrieval Bulletin, en junio / julio de 2006 Bulletin of the American Society for Information Science
^ "Ingwersen, P. (1992). Interacción de recuperación de información. Londres: Taylor Graham" . Archivado desde el original el 25 de noviembre de 2007 . Consultado el 28 de noviembre de 2007 .
^ "Grupo de trabajo de Mira (1996). Marcos de evaluación para aplicaciones de recuperación de información multimedia interactiva" . Archivado desde el original el 1 de febrero de 2008.
^ Grossman, D. y Frieder, O. (2004). Algoritmos de recuperación de información y heurística.
^ Koenemann, J. y Belkin, NJ (1996). Un caso de interacción: un estudio del comportamiento y la eficacia de la recuperación de información interactiva. En Proceedings of the SIGCHI Conference on Human Factors in Computing Systems: Common Ground (Vancouver, Columbia Británica, Canadá, 13-18 de abril de 1996). MJ Tauber, Ed. CHI '96. ACM Press, Nueva York, NY, 205-212
^ Borlund, P. (2003). El modelo de evaluación IIR: un marco para la evaluación de sistemas interactivos de recuperación de información. Investigación de la información, 8 (3), Documento 152
^ White, R., Capra, R., Golovchinsky, G., Kules, B., Smith, C. y Tunkelang, D. (2013). Introducción al número especial sobre recuperación de información entre humanos y computadoras. Revista de procesamiento y gestión de la información 49 (5), 1053-1057
^ Hearst, M. (1999). Interfaces de usuario y visualización, Capítulo 10 de Baeza-Yates, R. y Ribeiro-Neto, B., Modern Information Retrieval.
^ Rocchio, J. (1971). Retroalimentación de relevancia en la recuperación de información. En: Salton, G (ed), The SMART Retrieval System.

enlaces externos

"Talleres sobre recuperación de información por computadora humana" .
"Conferencia ACM SIGIR sobre interacción y recuperación de información humana (CHIIR)" .

[march2006-1] Marchionini, G. (2006). Toward Human-Computer Information Retrieval Bulletin, en junio / julio de 2006 Bulletin of the American Society for Information Science

[ingwer1992-2] "Ingwersen, P. (1992). Interacción de recuperación de información. Londres: Taylor Graham" . Archivado desde el original el 25 de noviembre de 2007 . Consultado el 28 de noviembre de 2007 .

[3] "Grupo de trabajo de Mira (1996). Marcos de evaluación para aplicaciones de recuperación de información multimedia interactiva" . Archivado desde el original el 1 de febrero de 2008.

[4] Grossman, D. y Frieder, O. (2004). Algoritmos de recuperación de información y heurística.

[koene1996-5] Koenemann, J. y Belkin, NJ (1996). Un caso de interacción: un estudio del comportamiento y la eficacia de la recuperación de información interactiva. En Proceedings of the SIGCHI Conference on Human Factors in Computing Systems: Common Ground (Vancouver, Columbia Británica, Canadá, 13-18 de abril de 1996). MJ Tauber, Ed. CHI '96. ACM Press, Nueva York, NY, 205-212

[borlund2003-6] Borlund, P. (2003). El modelo de evaluación IIR: un marco para la evaluación de sistemas interactivos de recuperación de información. Investigación de la información, 8 (3), Documento 152

[ipm2013-7] White, R., Capra, R., Golovchinsky, G., Kules, B., Smith, C. y Tunkelang, D. (2013). Introducción al número especial sobre recuperación de información entre humanos y computadoras. Revista de procesamiento y gestión de la información 49 (5), 1053-1057

[8] Hearst, M. (1999). Interfaces de usuario y visualización, Capítulo 10 de Baeza-Yates, R. y Ribeiro-Neto, B., Modern Information Retrieval.

[9] Rocchio, J. (1971). Retroalimentación de relevancia en la recuperación de información. En: Salton, G (ed), The SMART Retrieval System.

[1]