Memento es un proyecto financiado por el Programa Nacional de Preservación e Infraestructura de la Información Digital ( NDIIPP ) de los Estados Unidos cuyo objetivo es hacer que el contenido archivado en la Web sea más fácil de encontrar.
El proyecto está siendo dirigido por el Laboratorio Nacional de Los Alamos y la Universidad Old Dominion .
En lugar de esperar que la gente sepa sobre el creciente número de archivos web y adivinar qué archivo podría contener una versión anterior del recurso que están buscando, Memento propone hacer que el contenido archivado sea visible a través de la URL original que el buscador ya conocía. . Esencialmente, Memento es un intento de permitir a los usuarios ver cualquier página web como se veía en una fecha determinada en el pasado.
Descripción técnica
Existe una variedad de archivos web que recopilan revisiones específicas de páginas web tal como existían en un momento determinado. Memento permite al usuario realizar una transición fluida entre estos archivos en busca de la mejor página archivada que coincida con la fecha y hora de la página que desea.
Memento se define en RFC 7089 [1] como una implementación de la dimensión temporal de la negociación de contenido , como lo definió Tim Berners Lee en 1996. [2] HTTP logra la negociación de contenido a través de encabezados. La siguiente tabla muestra los diferentes encabezados disponibles para HTTP que permiten a los clientes y servidores encontrar el contenido que el usuario desea.
Encabezado de solicitud | Encabezado de respuesta | Dimensión | Ejemplos de | Referencia |
---|---|---|---|---|
Aceptar | Tipo de contenido | tipo de contenido de la representación | texto / html texto / imagen simple / png | RFC 7231 [3] RFC 2616 |
Aceptar-idioma | Contenido-Idioma | idioma de la representación | en en-US cz | RFC 7231 RFC 2616 |
Aceptar codificación | Codificación de contenido | medio, típicamente compresión, que el contenido ha sido codificado con | comprimir gzip desinflar | RFC 7231 RFC 2616 |
Aceptar-juego de caracteres | Tipo de contenido | el conjunto de caracteres utilizado por la página web | iso-8859-5 unicode-1-1 | RFC 7231 RFC 2616 |
Aceptar fecha y hora | Memento-Datetime | hora de la representación | Vie, 15 de Agosto de 2014 13:43:03 GMT | RFC 7089 |
Memento proporciona el encabezado de solicitud Accept-Datetime para que los clientes puedan proporcionar una fecha al servidor, y el servidor puede proporcionar la mejor versión archivada de una página para esa fecha. Esto se conoce como negociación de fecha y hora .
Para entender Memento completamente, uno debe darse cuenta de que el encabezado Last-Modified proporcionado por HTTP [4] no refleja necesariamente cuándo surgió una versión particular de una página web. Además, es posible que el encabezado Última modificación no exista en algunos casos. Para proporcionar más información, se ha introducido el encabezado Memento-Datetime para indicar cuándo se observó una representación específica de una página web en la web. [5]
El diagrama anterior muestra el proceso de 3 pasos mediante el cual Memento encuentra la mejor página web archivada para la fecha y hora proporcionada por el usuario. El proceso funciona de la siguiente manera:
- El cliente de Memento se pone en contacto con el recurso original para ver si devolverá información sobre un TimeGate (URI-G) en el encabezado del enlace.
- El cliente Memento luego usa el encabezado de solicitud Accept-Datetime para enviar la fecha y hora deseada por el usuario al URI-G descubierto en el paso anterior. La mayoría de los recursos en la web aún no devuelven un URI-G, por lo que la mayoría de los clientes de Memento usan una lista predefinida de TimeGates para realizar este paso. TimeGate luego devuelve un código de estado de redirección 302 y un encabezado de ubicación para indicarle al cliente dónde encontrar el recurso archivado (URI-M).
- El cliente de Memento luego solicita el recurso archivado (URI-M) como lo haría con cualquier otra página web. La respuesta para el URI-M contiene un Memento-Datetime que indica cuándo se observó en la web.
De esta manera, Memento utiliza la infraestructura existente de HTTP para lograr los objetivos de encontrar la mejor página web archivada en función de la fecha y hora y el URI deseados por el usuario.
Uso
Uno puede encontrar copias de la página simplemente navegando, en un navegador web, a un enlace formateado, reemplazando urltoarchive
con la URL completa de la página deseada: [6]
Descripción JSON de un Memento:
http://timetravel.mementoweb.org/api/json/YYYY/urltoarchive
http://timetravel.mementoweb.org/api/json/YYYYMM/urltoarchive
http://timetravel.mementoweb.org/api/json/YYYYMMDD/urltoarchive
http://timetravel.mementoweb.org/api/json/YYYYMMDDHH/urltoarchive
http://timetravel.mementoweb.org/api/json/YYYYMMDDHHMM/urltoarchive
- o
redirigir a un Memento con una fecha y hora cercana a la fecha y hora deseada:
http://timetravel.mementoweb.org/memento/YYYY/urltoarchive
http://timetravel.mementoweb.org/memento/YYYYMM/urltoarchive
http://timetravel.mementoweb.org/memento/YYYYMMDD/urltoarchive
http://timetravel.mementoweb.org/memento/YYYYMMDDHH/urltoarchive
http://timetravel.mementoweb.org/memento/YYYYMMDDHHMM/urltoarchive
Referencias
- ^ RFC 7089: Marco HTTP para acceso basado en tiempo a estados de recursos - Memento
- ^ Berners Lee, Tim. "Arquitectura web: recursos genéricos". Consorcio World Wide Web (W3C). 1996. http://www.w3.org/DesignIssues/Generic Archivado el 2 de junio de 2015 en la Wayback Machine.
- ^ RFC 7231: Protocolo de transferencia de hipertexto (HTTP / 1.1): Semántica y contenido
- ^ RFC 7232: Protocolo de transferencia de hipertexto (HTTP / 1.1): solicitudes condicionales
- ^ Nelson, Michael L. "05/11/2010: Memento-Datetime no es la última modificación". Grupo de Investigación en Ciencias Web y Bibliotecas Digitales. 5 de noviembre de 2010. http://ws-dl.blogspot.com/2010/11/2010-11-05-memento-datetime-is-not-last.html Archivado el 19 de mayo de 2015 en la Wayback Machine.
- ^ "API de viajes en el tiempo" . timetravel.mementoweb.org . Archivado desde el original el 21 de mayo de 2018 . Consultado el 15 de mayo de 2018 .
enlaces externos
- Proyecto Memento
- El Cuándo de la Web : información extensa sobre la propuesta y el experimento está disponible en el documento de noviembre de 2009
- Memento: Viaje en el tiempo para la Web
- http://lanlsource.lanl.gov/hello
- http://www.cdlib.org/cdlinfo/2010/02/04/web-archive-discovery-memento-implementation-meeting/