En la analítica web , una sesión o visita es una unidad de medida de las acciones de un usuario realizadas dentro de un período de tiempo o con respecto a la finalización de una tarea. Las sesiones también se utilizan en el análisis operativo y la provisión de recomendaciones específicas para el usuario . Hay dos métodos principales que se utilizan para definir una sesión: enfoques orientados al tiempo basados en la continuidad en la actividad del usuario y enfoques basados en la navegación basados en la continuidad en una cadena de páginas solicitadas .
Definición
La definición de "sesión" varía, especialmente cuando se aplica a los motores de búsqueda . [1] Generalmente, se entiende que una sesión consiste en "una secuencia de solicitudes realizadas por un solo usuario final durante una visita a un sitio en particular". [2] En el contexto de los motores de búsqueda , "sesiones" y "sesiones de consulta" tienen al menos dos definiciones. [1] Una sesión o sesión de consulta pueden ser todas las consultas realizadas por un usuario en un período de tiempo particular [3] o también puede ser una serie de consultas o navegaciones con una necesidad subyacente consistente del usuario. [4] [5]
Usos
Las sesiones por usuario se pueden utilizar como medida del uso del sitio web. [6] [7] Otras métricas utilizadas en la investigación y el análisis web aplicado incluyen la duración de la sesión, [8] y las acciones del usuario por sesión. [9] La duración de la sesión se considera una alternativa más precisa a la medición de las visitas a la página . [10]
Las sesiones reconstruidas también se han utilizado para medir la entrada total del usuario, incluso para medir la cantidad de horas de trabajo necesarias para construir Wikipedia . [11] Las sesiones también se utilizan para análisis operativo, anonimización de datos , identificación de anomalías en la red y generación de cargas de trabajo sintéticas para probar servidores con tráfico artificial. [12] [13]
Reconstrucción de sesiones
Es esencial para el uso de sesiones en analítica web poder identificarlas. Esto se conoce como "reconstrucción de sesión". Los enfoques para la reconstrucción de sesiones se pueden dividir en dos categorías principales: orientados al tiempo y orientados a la navegación. [14]
Enfoques orientados al tiempo
Los enfoques orientados al tiempo para la reconstrucción de sesiones buscan un período establecido de inactividad del usuario comúnmente llamado "umbral de inactividad". Una vez que se alcanza este período de inactividad, se asume que el usuario ha abandonado el sitio o ha dejado de usar el navegador por completo y la sesión finaliza. Las solicitudes adicionales del mismo usuario se consideran una segunda sesión. Un valor común para el umbral de inactividad es de 30 minutos y, a veces, se describe como el estándar de la industria. [15] [16] Algunos han argumentado que un umbral de 30 minutos produce artefactos alrededor de sesiones naturalmente largas y han experimentado con otros umbrales. [17] [18] Otros simplemente afirman: "ningún umbral de tiempo es efectivo para identificar [sesiones]". [19]
Una alternativa que se ha propuesto es utilizar umbrales específicos del usuario en lugar de un único umbral global para todo el conjunto de datos. [20] [21] Esto tiene el problema de asumir que los umbrales siguen una distribución bimodal y no es adecuado para conjuntos de datos que cubren un período de tiempo prolongado. [17]
Los enfoques orientados a la navegación explotan la estructura de los sitios web, específicamente, la presencia de hipervínculos y la tendencia de los usuarios a navegar entre páginas del mismo sitio web haciendo clic en ellas, en lugar de escribir la URL completa en su navegador. [14] Una forma de identificar sesiones al observar estos datos es construir un mapa del sitio web: si se puede identificar la primera página del usuario, la "sesión" de acciones dura hasta que llegan a una página a la que no se puede acceder desde ninguna de las páginas a las que se accedió anteriormente. Esto tiene en cuenta el retroceso, donde un usuario volverá sobre sus pasos antes de abrir una nueva página. [22] Un enfoque más simple, que no tiene en cuenta el retroceso, es simplemente requerir que el referente HTTP de cada solicitud sea una página que ya está en la sesión. Si no es así, se crea una nueva sesión. [23] Esta clase de heurística "presenta un rendimiento muy deficiente" en sitios web que contienen conjuntos de marcos . [24]
Referencias
- ↑ a b Gayo-Avello , 2009 , p. 1824.
- ^ Arlitt 2000 , p. 2.
- ^ Donato 2010 , p. 324.
- ^ Gayo-Avello 2009 , p. 1825.
- ^ Lam 2007 , p. 147.
- ^ Weischdel , 2006 , p. 464.
- ^ Catledge 1995 , p. 5.
- ^ Jansen , 2006 , p. 10.
- ^ Jansen 2000 , p. 12.
- ^ Khoo 2008 , p. 377.
- ↑ Geiger , 2014 , p. 1.
- ^ Meiss 2009 , p. 177.
- ^ Arlitt 2000 , p. 8.
- ↑ a b Spiliopoulou , 2003 , p. 176.
- ^ Ortega 2010 , p. 332.
- ^ Eickhoff 2014 , p. 3.
- ↑ a b Mehrzadi , 2012 , p. 3.
- ^ Él 2002 , p. 733.
- ^ Jones , 2008 , p. 2.
- ^ Murray , 2006 , p. 3.
- ↑ Mehrzadi , 2012 , p. 1.
- ^ Cooley 1999 , p. 19.
- ^ Cooley 1999 , p. 23.
- ^ Berendt 2003 , p. 179.
Bibliografía
- Arlitt, Martin (2000). "Caracterización de las sesiones de usuarios web" (PDF) . Revisión de la evaluación del desempeño de SIGMETRICS . 28 (2): 50–63. doi : 10.1145 / 362883.362920 . S2CID 2946044 .
- Berendt, Bettina; Mobasher, Bamshad; Nakagawa, Miki; Spiliopoulou, Myra (2003). "El impacto de la estructura del sitio y el entorno del usuario en la reconstrucción de sesiones en el análisis de uso de la web" (PDF) . WEBKDD 2002: minería de datos web para descubrir patrones de uso y perfiles . WEBKDD. Saltador. doi : 10.1007 / 978-3-540-39663-5_10 . ISBN 978-3-540-39663-5.
- Catledge, L .; Pitkow, J. (1995). "Caracterización de estrategias de navegación en la world wide web" (PDF) . Actas de la Tercera Conferencia Internacional World-Wide Web sobre Tecnología, Herramientas y Aplicaciones . 27 (6): 1065–1073. doi : 10.1016 / 0169-7552 (95) 00043-7 .
- Cooley, Robert; Mobasher, Bamshad; Srivastava, Jaideep (1999). "Preparación de datos para la minería de patrones de navegación en la World Wide Web" (PDF) . Sistemas de conocimiento e información . 1 (1): 5–32. CiteSeerX 10.1.1.33.2792 . doi : 10.1007 / BF03325089 . ISSN 0219-3116 . S2CID 1165622 .
- Donato, Debora ; Bonchi, Francesco; Chi, Tom (2010). "¿Quieres tomar notas ?: identificar las misiones de investigación en el panel de búsqueda de Yahoo" (PDF) . Actas de la XIX Conferencia Internacional sobre World Wide Web . ACM. doi : 10.1145 / 1772690.1772724 . S2CID 6951065 .
- Eickhoff, Carsten; Teevan, Jaime; White, Ryen; Dumais, Susan. (2014). Lecciones del viaje: un análisis de registro de consultas del aprendizaje dentro de la sesión (PDF) . Actas de la Séptima Conferencia Internacional sobre Búsqueda Web y Minería de Datos Web . ACM. págs. 223-232. doi : 10.1145 / 2556195.2556217 . ISBN 9781450323512. S2CID 14666769 .
- Gayo-Avello, Daniel (2009). "Una encuesta sobre los métodos de detección de sesiones en los registros de consultas y una propuesta de evaluación futura" (PDF) . Ciencias de la información . 179 (12): 1822–1843. doi : 10.1016 / j.ins.2009.01.026 . hdl : 10651/8686 . ISSN 0020-0255 .{{Dead link} | fecha = enero de 2017}
- Geiger, RS; Halfaker, A. (2014). Uso de Editar sesiones para medir la participación en Wikipedia (PDF) . Actas de la Conferencia ACM 2013 sobre trabajo cooperativo asistido por computadora . ACM. pag. 861. doi : 10.1145 / 2441776.2441873 . ISBN 9781450313315. S2CID 7166943 .
- Él, Daqing; Goker, Ayse; Harper, David J. (2002). "Combinación de pruebas para la identificación automática de sesiones web". Tratamiento y Gestión de la Información . 38 (5): 727–742. doi : 10.1016 / S0306-4573 (01) 00060-7 . ISSN 0306-4573 .
- Heer, Jeffrey; Chi, Ed H. (2002). "Separando el enjambre: métodos de categorización para sesiones de usuario en la web" (PDF) . Actas de la Conferencia SIGCHI sobre factores humanos en sistemas informáticos . ACM. 4 (1). doi : 10.1145 / 503376.503420 . S2CID 14018957 .
- Huang, Chien-Kang; Chien, Lee-Feng; Oyang, Yen ‐ Jen (2003). "Sugerencia de término relevante en búsqueda web interactiva basada en información contextual en registros de sesión de consulta". Revista de la Sociedad Estadounidense de Ciencia y Tecnología de la Información . 54 (7): 638–649. CiteSeerX 10.1.1.105.5584 . doi : 10.1002 / asi.10256 .
- Jansen, Bernard J .; Spink, Amanda; Saracevic, Tefko (2000). "La vida real, los usuarios reales y las necesidades reales: un estudio y análisis de las consultas de los usuarios en la web" (PDF) . Tratamiento y Gestión de la Información . 36 (2): 207–227. CiteSeerX 10.1.1.155.1383 . doi : 10.1016 / S0306-4573 (99) 00056-4 . ISSN 0306-4573 .
- Jansen, Bernard J .; Spink, Amanda (2006). "¿Cómo estamos buscando en la World Wide Web? Una comparación de nueve registros de transacciones de motores de búsqueda" (PDF) . Tratamiento y Gestión de la Información . 42 (1): 248–263. doi : 10.1016 / j.ipm.2004.10.007 . ISSN 0306-4573 .
- Jones, Rosie; Klinkner, Kristina Lisa (2008). Más allá del tiempo de espera de la sesión: segmentación jerárquica automática de temas de búsqueda en registros de consultas (PDF) . Cikm 08 . ACM. pag. 699. doi : 10.1145 / 1458082.1458176 . ISBN 9781595939913. S2CID 6548724 .
- Khoo, Michael; Pagano, Joe; Washington, Anne L .; Recker, Mimi; Palmer, Bart; Donahue, Robert A. (2008). "Uso de métricas web para analizar bibliotecas digitales" (PDF) . Actas de la octava conferencia conjunta ACM / IEEE-CS sobre bibliotecas digitales . ACM.
- Lam, Heidi ; = Russell, Daniel; Tang, Diane (2007). "Visor de sesiones: análisis exploratorio visual de registros de sesiones web". Simposio IEEE sobre ciencia y tecnología de análisis visual . IEEE.
- Mehrzadi, David; Feitelson, Dror G. (2012). "Sobre la extracción de datos de sesión de registros de actividad" (PDF) . Actas de la 5ª Conferencia Anual Internacional de Sistemas y Almacenamiento . SYSTOR '12. ACM. CiteSeerX 10.1.1.381.1956 . doi : 10.1145 / 2367589.2367592 . ISBN 978-1-4503-1448-0. S2CID 8820623 .
- Meiss, Mark; Duncan, John; Gonçalves, Bruno; Ramasco, José J .; Menczer, Filippo (2009). "Qué hay en una sesión: seguimiento del comportamiento individual en la Web" (PDF) . Actas de la 20ª Conferencia ACM sobre hipertexto e hipermedia . ACM. arXiv : 1003.5325 . doi : 10.1145 / 1557914.1557946 . S2CID 6564335 .
- Menascé, Daniel A .; Almeida, V .; Fonseca, R .; Mendes, M. (1999). "Una metodología para la caracterización de la carga de trabajo de los sitios de comercio electrónico" (PDF) . Actas de la Conferencia ACM sobre Comercio Electrónico . ACM: 119-128. doi : 10.1145 / 336992.337024 . ISBN 1581131763. S2CID 7239612 .
- Murray, G. Craig; Lin, Jimmy; Chowdhury, Abdur (2006). "Identificación de sesiones de usuario con agrupación aglomerativa jerárquica" (PDF) . Actas de la Sociedad Estadounidense de Ciencia y Tecnología de la Información . 43 (1): 1–9. doi : 10.1002 / meet.14504301312 .
- Ortega, JL; Aguillo, I. (2010). "Diferencias entre sesiones web según el origen de sus visitas" (PDF) . Revista de Informetrics . 4 (3): 331–337. doi : 10.1016 / j.joi.2010.02.001 . ISSN 1751-1577 .
- Spiliopoulou, Myra; Mobasher, Bamshad; Berendt, Bettina; Nakagawa, Miki (2003). "Un marco para la evaluación de la heurística de reconstrucción de sesiones en el análisis del uso de la web" (PDF) . INFORMA Revista de Computación . 15 (2): 171-190. CiteSeerX 10.1.1.621.3037 . doi : 10.1287 / ijoc.15.2.171.14445 . ISSN 1526-5528 .
- Weischdel, Birgit; Huizingh, Eelko KRE (2006). Optimización de sitios web con métricas web: un caso de estudio (PDF) . Actas de la VIII Conferencia Internacional de Comercio Electrónico . pag. 463. doi : 10.1145 / 1151454.1151525 . ISBN 978-1595933928. S2CID 2965255 .