archive.today es un servicio de archivo web bajo demanda en https://archive.today . Un servicio de archivo web permite a los editores de Wikipedia reducir la descomposición de los enlaces al conservar una copia de una fuente en línea a la que se puede acceder si la página original se mueve, cambia o desaparece. No todas las páginas web se pueden archivar con archive.today. [1]
archive.today puede archivar páginas web HTML , hojas de estilo , JavaScript e imágenes digitales .
Además de https://archive.today , también se puede acceder al dominio a través de alias, incluidos https://archive.is , .li, .fo, .ph. .vn y .md
Diferencias con otros archivadores
Otros servicios de archivo web incluyen Wayback Machine y al menos otros 20 proveedores en uso en Wikipedia , aunque más del 80% de todos los archivos en uso son Wayback. Los dos funcionan de forma diferente y determinadas páginas pueden ser archivadas por uno pero no por el otro. Similar a archive.today, Wayback Machine toma instantáneas de páginas web en ciertos momentos, así como también archiva bajo demanda iniciado por el usuario llamado "Guardar página ahora" (SPN). [2] [3]
Copyright y robots.txt
archive.today elimina las páginas archivadas a solicitud de los titulares de los derechos de autor según la DMCA de EE. UU. [4] Las solicitudes se pueden realizar con el enlace "Informar abuso" en las páginas archivadas de archive.today. Volver a alojar material protegido por derechos de autor de EE. UU. Sin permiso puede ser una violación de la Ley de Derechos de Autor del Milenio Digital de EE. UU . (DMCA); por esta razón, para evitar implicar a Wikipedia en violaciones de las leyes de derechos de autor e incurrir en solicitudes de eliminación de la DMCA, se debe usar archive.today con cierta precaución con respecto al contenido con derechos de autor de EE. UU.
La historia de los proveedores de archivos y robots.txt es más larga y compleja que el enfoque de este ensayo. Brevemente, el estándar de exclusión de robots nunca fue diseñado para ser utilizado por proveedores de archivos. El uso de robots.txt para este propósito es esencialmente un truco que tuvo consecuencias no deseadas, por ejemplo, dominios que son secuestrados o cambian de propiedad y el nuevo propietario del dominio agrega un archivo robots.txt que hace que los proveedores de archivos bloqueen la visualización de archivos desde el sitio original, aunque el sitio anterior nunca tuvo un archivo robots.txt. Sin embargo, algunos proveedores de archivos acordaron utilizar robots.txt como un método para que los usuarios finales indiquen cuándo no querían que sus páginas se archivaran y / o mostraran públicamente ( si ya está archivado). archive.today no cumple con el estándar de exclusión de Robots . [5] Wayback Machine anteriormente [6] lo usaba para evitar archivar material que los propietarios del sitio no quieren archivar. [7] [8]
Tenga en cuenta que a veces puede ser una buena idea agregar varios proveedores de archivos para el material clave. Se pueden agregar varios enlaces a Wikipedia usando .{{webarchive}}
Cómo archivar
Hay varias formas de enviar una página web a archive.today para su archivo. Para los nuevos usuarios, se sugiere el formulario del sitio web. Los otros métodos se adaptan mejor a quienes utilizan archive.today con regularidad.
Formulario del sitio web
Este método es fácil de usar. Requiere ir al sitio web archive.today para archivar una página web.
- En
https://archive.today/
, ingrese la URL de la página web que desea archivar en el campo "Mi URL está activa y quiero archivar su contenido" (el rojo). - Haga clic en el botón "Enviar". Cuando se completa el proceso de archivado (normalmente tarda de 5 a 15 segundos), se le enviará a la página archivada.
- Se recomienda que vea la página archivada para comprobar si el proceso de archivado se ha realizado correctamente.
Bookmarklet
Un bookmarklet es un marcador de navegador web que realiza una determinada función. El bookmarklet archive.today, cuando se hace clic en él, toma la URL de la página que está viendo actualmente y la envía a archive.today para su archivo. Este método es sencillo de configurar y conveniente. Se recomienda que tenga su barra de Marcadores / Favoritos visible o al menos tenga sus marcadores accesibles con un clic o dos. Este método solo le permite archivar la página que está viendo actualmente. Para archivar una página web diferente, deberá utilizar otro método.
- Para configurar el marcador, primero cree un marcador para cualquier página. Luego, siga los siguientes dos pasos para cambiarlo para que funcione.
- Cambie o ingrese el nombre del marcador (p
archive.today
. Ej .). - Cambie o ingrese
javascript:void(open('https://archive.today/?run=1&url='+document.location))
en el campo Ubicación.
- Para utilizar el bookmarklet, simplemente haga clic en él cuando esté en una página web que desee archivar. Inicia el proceso de archivo. Cuando se complete el proceso (generalmente toma de 5 a 15 segundos), se lo enviará a la página archivada.
- Se recomienda que vea la página archivada para verificar si el proceso de archivo fue exitoso.
Palabra clave inteligente de Firefox
Las palabras clave inteligentes de Firefox se utilizan comúnmente para realizar búsquedas a través de la barra de direcciones de Firefox o para abrir un marcador escribiendo una palabra clave en la barra de direcciones de Firefox. Aquí vamos a utilizar una palabra clave inteligente para enviar una URL a archive.today para su archivo. Este método es moderadamente sencillo de configurar.
- Para configurar la palabra clave inteligente, presione Ctrl + Shift + B para abrir su Biblioteca de marcadores (o haga clic en el botón naranja de Firefox en la parte superior izquierda de la ventana, luego vaya a "Marcadores", luego "Mostrar todos los marcadores").
- Busque una ubicación en la que le gustaría guardar el marcador inteligente de palabras clave.
- En el menú de la parte superior de la ventana, haz clic en "Organizar" y luego en "Nuevo marcador".
- Introduzca un nombre para el marcador (p
archive.today
. Ej .). - Ingrese
https://archive.today/?run=1&url=%s
en el campo Ubicación. - Ingrese una palabra clave para el marcador. Debe elegir algo corto y esta palabra clave no debe usarse ya para otro marcador (por ejemplo
wc
). - Haga clic en el botón "Agregar". Cierre la biblioteca de marcadores.
- Para usar la palabra clave inteligente, agregue la palabra clave que eligió ("
wc
" en el ejemplo anterior) seguida de un espacio ("a http://www.example.com/pageyouwantoarchive.html
). - Pulsa Enter. Inicia el proceso de archivo. Cuando se completa el proceso de archivado (normalmente tarda de 5 a 15 segundos), se le enviará a la página archivada.
- Se recomienda que vea la página archivada para comprobar si el proceso de archivado se ha realizado correctamente.
Motor de búsqueda de Chrome
Aunque esto se crea a través de la función del motor de búsqueda de Chrome, funciona como una palabra clave inteligente en Firefox. Este método es moderadamente sencillo de configurar.
- Para configurar el "motor de búsqueda", haga clic con el botón derecho en la barra de direcciones y seleccione "Editar motores de búsqueda ...". En la parte inferior de la lista que aparece, puede agregar un "motor de búsqueda".
- Introduzca un nombre para el "motor de búsqueda" en el primer campo (p
archive.today
. Ej .). - Ingrese una palabra clave para el "motor de búsqueda" en el segundo campo. Debe elegir algo corto y esta palabra clave no debe estar ya utilizada (p
wc
. Ej .). - Ingrese
https://archive.today/?run=1&url=%s&
en el tercer campo. - Presiona Enter para guardar el "motor de búsqueda".
- Para utilizar el "motor de búsqueda", agregue la palabra clave que eligió ("
wc
" en el ejemplo anterior) seguida de un espacio ("a http://www.example.com/pageyouwantoarchive.html
). - Pulsa Enter. Se le enviará a una página que contiene un enlace a la URL de archivo de la página web que desea archivar.
- Se recomienda que vea la página archivada para comprobar si el proceso de archivado se ha realizado correctamente.
Usar dentro de Wikipedia
Los enlaces archivados con archive.today deben aparecer en formato largo. (Consulte la charla de Wikipedia: Uso de archive.today § RfC: ¿Deberíamos usar URL de formato corto o largo? )
Un ejemplo de formato largo:
https://archive.today/YYYY.MM.DD-hhmmss/http://www.example.com
Esta URL de archivo se puede insertar en archiveurl=
y sus parámetros de soporte archivedate=
y url-status=
en cualquiera de las plantillas de citas . Si ya no se puede acceder a la URL original , el url-status
valor del parámetro debe establecerse en dead
. Si aún se puede acceder a la URL original, el url-status
valor del parámetro debe establecerse en live
.
Búsqueda de páginas web previamente archivadas
Las páginas web previamente archivadas a través de archive.today son accesibles a través de una base de datos con capacidad de búsqueda. Los usuarios pueden buscar por URL, dominio o sus comodines .
Consenso
La solicitud de comentarios (RfC) realizada en Wikipedia: Archive.is RFC 4 finalizó en junio de 2016 con un consenso para eliminar archive.is de la lista negra. El consenso anterior, establecido anteriormente en Wikipedia: Archive.is RFC 3 , era poner en la lista negra los enlaces a archive.today, tan pronto como se eliminaran todos los enlaces existentes.
Ver también
- Wikipedia: Link Rot , guía práctica para la prevención de Link Rot
- Wikipedia: Uso de Wayback Machine , guía práctica
- Wikipedia: uso de WebCite , guía práctica
- Charla: Perma.cc § Perma.cc y Wikipedia , sobre el uso de Perma.cc
Referencias
- ^ "Preguntas frecuentes" .
Es posible que una página no se archive por varios motivos. archive.today no admite el almacenamiento de archivos de formato de documento portátil , audio y video. La página puede ser demasiado grande (hay un límite de 50 MB para una sola página). El contenido puede ser inaccesible desde la red archive.today (esto es particularmente probable si está intentando acceder a contenido basado en suscripción que su institución suscribe en nombre de sus usuarios). Además, el contenido puede ser ilegible por el archivador archive.today (las páginas basadas en JavaScript demasiado complejas pueden bloquear su navegador o ejecutarse durante demasiado tiempo, o las que involucran verificaciones del navegador a veces hacen que nuestro motor de archivo falle). … Las páginas que violen las reglas de nuestro proveedor de servicios de alojamiento (cracks, pornografía, etc.) pueden eliminarse. Además, las páginas completamente vacías (o páginas que no tienen nada más que texto como "502 Server Timeout") se pueden eliminar.
- ^ Harihareswara, Sumana (3 de septiembre de 2013). "Wikitech-l - formato de feed de cambios recientes" . Lista de correo técnico de Wikimedia.org . Archivado desde el original el 26 de octubre de 2013.
- ^ "Guardar páginas en la Wayback Machine" . Archivo de Internet . 2018. Archivado desde el original el 14 de julio de 2020 . Consultado el 19 de mayo de 2021 .
Guardar página ahora : Ponga una URL en el formulario, presione el botón y guardamos la página. Al instante tendrá una URL permanente para su página. Tenga en cuenta que este método solo guarda una página , no todo el sitio.
- ^ "¿Cómo puedo eliminar una página archivada?" . Blog . 24 de enero de 2013. Archivado desde el original el 26 de septiembre de 2013.
- ^ Dascalescu, Dan (18 de febrero de 2013). "Archivo de páginas web" . Wiki . Dan Dascalescu. Archivado desde el original el 22 de septiembre de 2013.
- ^ "Robots.txt destinado a motores de búsqueda no funciona bien para archivos web" .
- ^ "Eliminación de documentos de la Wayback Machine" . Archivado desde el original el 15 de octubre de 2002.
- ^ "Algunos sitios no están disponibles debido a robots.txt u otras exclusiones. ¿Qué significa eso?" . FAQ . Archivado desde el original el 4 de octubre de 2002.