archive.today (anteriormente archive.is ) es un sitio de archivo que almacena instantáneas de páginas web. [3] Recupera una página a la vez similar a WebCite , de menos de 50 MB cada una, pero con soporte para sitios con mucho JavaScript como Google Maps y aplicaciones web progresivas como Twitter .
Tipo de sitio | Archivo web |
---|---|
Disponible en | Plurilingüe |
URL |
|
Comercial | sí |
Registro | No |
Lanzado | 16 de mayo de 2012 [1] [2] |
Archive.today registra simultáneamente dos 'instantáneas' diferentes de una página web. Uno es "Página web", que incluye todos los enlaces activos funcionales que se encuentran en el original. El otro es "Captura de pantalla", que proporciona una visualización estática y no interactiva de la representación. [4]
Características
Funcionalidad
Archive.today puede capturar páginas individuales en respuesta a solicitudes explícitas de los usuarios. [5] [6] [7] Desde sus inicios, Archive.Today admite el rastreo de páginas con URL que contienen un fragmento hash-bang ahora obsoleto ( #! ). [8]
Archive.today registra solo texto e imágenes, excluyendo video, XML , RTF , hojas de cálculo ( xls u ods ) y otro contenido no estático . Realiza un seguimiento del historial de instantáneas guardadas, devolviendo al usuario una solicitud de confirmación antes de agregar una nueva instantánea de una dirección de Internet ya guardada. [9]
Las páginas se capturan con 1024 píxeles de ancho del navegador. CSS se convierte en CSS en línea , eliminando el diseño web receptivo y los selectores como :hover
y :active
. El contenido generado con JavaScript durante el proceso de rastreo aparece en un estado congelado. [10] Los nombres de las clases HTML se conservan dentro del old-class
atributo .
Cuando se selecciona texto , un subprograma de JavaScript [se necesita aclaración ] genera un fragmento de URL que se ve en la barra de URL del navegador que resalta automáticamente esa parte del texto cuando se vuelve a visitar.
Las páginas web no se pueden duplicar de archive.is a web.archive.org como copia de seguridad de segundo nivel , ya que archive.is coloca una exclusión para Wayback Machine y no guarda sus instantáneas en formato WARC. Lo contrario, de web.archive.org a archive.is, es posible, [11] [ referencia circular ] pero la copia suele llevar más tiempo que una captura directa. Algunos sitios web se eliminan de las listas de Internet Archive de forma retroactiva o se bloquean para que no se guarden debido a su archivo robots.txt , pero Archive.today no usa esto. [ cita requerida ]
La barra de herramientas de búsqueda habilita operadores avanzados de palabras clave, utilizando *
como carácter comodín . Un par de comillas frente a la búsqueda de una secuencia exacta de palabras clave presentes en el título o en el cuerpo de la página web, mientras que los insite restringe operador a un dominio específico de Internet. [12]
Una vez que se archiva una página web, ningún usuario de Internet puede eliminarla directamente. [13]
Al guardar una lista dinámica , el cuadro de búsqueda archive.today muestra solo un resultado que vincula la sección anterior y la siguiente de la lista (por ejemplo, 20 vínculos por página). [14] Las otras páginas web guardadas se filtran y, a veces, se pueden encontrar por una de sus apariciones. [ cita requerida ]
La función de búsqueda está respaldada por Google CustomSearch. Si no ofrece resultados, archive.is intenta utilizar Yandex Search . [ cita requerida ]
Si una página ya ha sido archivada, archive.is le pide al usuario que confirme que ha archivado una nueva revisión, en lugar de archivarla inmediatamente. [ cita requerida ]
Al cargar una página, se muestra una lista de URL a elementos de página individuales entre sus tamaños de contenido, estados HTTP y tipos MIME . Esta lista solo se puede ver durante el proceso de rastreo. [ cita requerida ]
Se pueden descargar las páginas archivadas como un archivo ZIP, excepto las páginas archivadas desde el 29 de noviembre de 2019, cuando Archive.Today cambió su motor de navegador de PhantomJS a Chromium . [15]
Desde julio de 2013, archive.today es compatible con la interfaz de programación de aplicaciones (API) de Memento Project . [16] [17]
Historia
Archive.today se fundó en 2012. El sitio originalmente se denominó archive.today, pero en mayo de 2015, cambió el espejo principal a archive.is. [18]
En enero de 2019, comenzó a desaprobar el dominio archive.is en favor del espejo archive.today. [19]
Disponibilidad mundial
Australia
En marzo de 2019, el sitio fue bloqueado durante seis meses por varios proveedores de Internet australianos a raíz de los tiroteos en la mezquita de Christchurch en un intento de limitar la distribución de las imágenes del ataque. [20] [21]
porcelana
Según GreatFire .org, archive.today ha estado bloqueado en China desde marzo de 2016, [22] archive.li desde septiembre de 2017, [23] y archive.fo desde julio de 2018. [24]
Finlandia
El 21 de julio de 2015, los operadores bloquearon el acceso al servicio desde todas las direcciones IP finlandesas , indicando en Twitter que lo hicieron para evitar una escalada de una disputa que supuestamente tenían con el gobierno finlandés. [25]
Rusia
En Rusia , solo es posible el acceso HTTP; Las conexiones HTTPS están bloqueadas. [26] [27]
Ver también
- Preservación digital
- Lista de iniciativas de archivo web
- Archivo de Internet
- Podredumbre de enlaces
- Wikipedia: Podredumbre de enlaces
- Perma.cc
- Wayback Machine
- Archivo web
- WebCite
Referencias
- ^ Blog Archive.is - ¿Cuándo se lanzó originalmente el sitio Archive-is? en archive.today (archivado el 20 de marzo de 2021)
- ^ Archive.is - Викиреальность en archive.today (archivado el 29 de abril de 2021)
- ^ Brinkmann, Martin (22 de abril de 2015). "Cree archivos de páginas web disponibles públicamente con Archive.is" . Ghacks . Archivado desde el original el 12 de abril de 2019 . Consultado el 13 de junio de 2015 .
- ^ Brunelle, Justin F .; Kelly, Mat; Weigle, Michele C .; Nelson, Michael L. (25 de enero de 2015). "El impacto de JavaScript en la capacidad de archivo" (PDF) . Revista Internacional de Bibliotecas Digitales . 17 (2): 95-117. doi : 10.1007 / s00799-015-0140-8 . S2CID 8433375 . Archivado (PDF) desde el original el 27 de mayo de 2019.
- ^ Dascalescu, Dan (18 de febrero de 2013). "Archivo de páginas web - Wiki de Dan Dascalescu (revisión)" . Wiki.dandascalescu.com. Archivado desde el original el 22 de septiembre de 2013 . Consultado el 3 de octubre de 2013 .
- ^ Koebler, Jason (29 de octubre de 2014). "Estimado GamerGate: Por favor, deje de robarnos nuestra mierda" . Placa base . Archivado desde el original el 27 de mayo de 2019 . Consultado el 22 de marzo de 2017 .
No hay forma de que un sitio web se proteja de que un usuario de Archive.today refleje el sitio.
- ^ "archive.is/faq" . archive.is . Consultado el 15 de febrero de 2019 .
- ^ "Página de inicio de Archive.is en 2013" . Archivado desde el original el 12 de enero de 2013.
Puede guardar páginas de sitios Web 2.0 incluso con URL hashbang, por ejemplo http://twitter.com/#!/medvedevrussia
- ^ "Ejemplo de historial de instantáneas en archive.is" .
- ^ Animación de carga generada por JavaScript delvideode Dailymotion que aparece en un estado congelado
- ^ "Ejemplo: página guardada de Web Archive en Archive.is" . Archivado desde el original el 20 de mayo de 2013 . Consultado el 23 de octubre de 2019 .
- ^ Por ejemplo, la cadena insite: https://en.wikipedia.org "World Cup" devuelve "World + Cup" / instantáneas relacionadas
- ^ "Algunas preguntas frecuentes" . archive.is blog . 24 de enero de 2013. Archivado desde el original el 26 de septiembre de 2013 . Consultado el 12 de noviembre de 2018 .
- ^ "Ejemplo de lista dinámica recuperada por Worldcat" .
- ^ "Blog de Archive.is" . 17 de julio de 2020. Archivado desde el original el 3 de octubre de 2020.
- ^ Nelson, Michael L. (9 de julio de 2013). "Archive.is apoya Memento" . Actualizaciones de investigación y docencia . Grupo de Investigación en Ciencias Web y Bibliotecas Digitales en Old Dominion University . Archivado desde el original el 27 de julio de 2013 . Consultado el 17 de septiembre de 2013 .
- ^ "archive.is" . Información del protocolo Memento . Memento Development Group. Archivado desde el original el 15 de septiembre de 2013 . Consultado el 17 de septiembre de 2013 .
- ^ "¿Por qué cambió la URL de archivo-hoy a archivo-es?" . Blog Archive.is . 3 de mayo de 2015. Archivado desde el original el 1 de junio de 2015 . Consultado el 6 de enero de 2019 .
- ^ @archiveis (4 de enero de 2019). "Por favor, no use el espejo archive.IS para vincular, use otros espejos [.TODAY .FO .LI .VN .MD .PH]. .IS podría dejar de funcionar pronto" (Tweet). Archivado desde el original el 6 de enero de 2019, a través de Twitter .
- ^ "Los ISP de Australia y Nueva Zelanda comienzan a censurar Internet sin precedentes legales" . Acceso privado a Internet . 19 de marzo de 2019 . Consultado el 20 de marzo de 2019 .
- ^ "Los ISP de Nueva Zelanda dicen que están bloqueando sitios que no eliminan el video de disparo de Christchurch" . Gizmodo Australia . 19 de marzo de 2019. Archivado desde el original el 18 de mayo de 2019 . Consultado el 20 de marzo de 2019 .
- ^ "archive.is está 100% bloqueado en China" . GreatFire Analyzer . 12 de agosto de 2018. Archivado desde el original el 12 de agosto de 2018.
- ^ "archive.li está 100% bloqueado en China" . Gran analizador de incendios . 12 de agosto de 2018. Archivado desde el original el 12 de agosto de 2018.
- ^ "archive.fo está 100% bloqueado en China" . Gran analizador de incendios . 12 de agosto de 2018. Archivado desde el original el 12 de agosto de 2018.
- ^ Lapintie, Lassi (22 de julio de 2015). "Suomalaisilta estettiin haktivistien suosimalla verkkosivulla käynti" [ Se bloquea el acceso de los finlandeses al sitio web utilizado por los hacktivistas]. Iltalehti (en finlandés). Archivado desde el original el 27 de mayo de 2019 . Consultado el 4 de marzo de 2016 .
- ^ Elistratov, Vladimir (29 de enero de 2016). "Roskomnadzor zablokiroval servis archive.is, khranyashchiy kopii veb-saytov"Роскомнадзор заблокировал сервис archive.is, хранящий копии веб-сайтов. TJournal (en ruso). Archivado desde el original el 30 de agosto de 2017 . Consultado el 30 de enero de 2016 .
- ^ Cushing, Tim (4 de febrero de 2016). "Rusia bloquea otro sitio de archivo porque podría contener páginas antiguas sobre drogas" . Techdirt . Archivado desde el original el 23 de marzo de 2019 . Consultado el 26 de febrero de 2016 .
enlaces externos
- Página web oficial
- Archive.is blog en Tumblr
- archive.today en Twitter
- Archive.today en Crunchbase