De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda

archive.today (anteriormente archive.is ) es un sitio de archivo que almacena instantáneas de páginas web. [1] Recupera una página a la vez similar a WebCite , de menos de 50 MB cada una, pero con soporte para sitios con mucho JavaScript como Google Maps y aplicaciones web progresivas como Twitter .

Archive.today registra simultáneamente dos 'instantáneas' diferentes de una página web. Uno es "Página web", que incluye todos los enlaces activos funcionales que se encuentran en el original. El otro es "Captura de pantalla", que proporciona una visualización estática y no interactiva de la representación. [2]

Funciones [ editar ]

Funcionalidad [ editar ]

Archive.today puede capturar páginas individuales en respuesta a solicitudes explícitas de los usuarios. [3] [4] [5] Desde sus inicios, Archive.Today admite el rastreo de páginas con URL que contienen un fragmento hash-bang ahora obsoleto ( #! ). [6]

Archive.today registra solo texto e imágenes, excluyendo video, XML , RTF , hojas de cálculo ( xls u ods ) y otro contenido no estático . Realiza un seguimiento del historial de instantáneas guardadas, devolviendo al usuario una solicitud de confirmación antes de agregar una nueva instantánea de una dirección de Internet ya guardada. [7]

Las páginas se capturan con 1024 píxeles de ancho del navegador. CSS se convierte en CSS en línea , eliminando el diseño web receptivo y los selectores como :hovery :active. El contenido generado con JavaScript durante el proceso de rastreo aparece en un estado congelado. [8] Los nombres de las clases HTML se conservan dentro del old-class atributo .

Cuando se selecciona texto , un subprograma de JavaScript [se necesita aclaración ] genera un fragmento de URL que se ve en la barra de URL del navegador que resalta automáticamente esa parte del texto cuando se vuelve a visitar.

Las páginas web no se pueden duplicar de archive.is a web.archive.org como respaldo de segundo nivel , ya que archive.is coloca una exclusión para Wayback Machine y no guarda sus instantáneas en formato WARC. Lo contrario, de web.archive.org a archive.is, es posible, [9] [ referencia circular ] pero la copia suele llevar más tiempo que una captura directa. Algunos sitios web se eliminan de las listas de Internet Archive de forma retroactiva o se bloquean para que no se guarden debido a su archivo robots.txt , pero Archive.today no usa esto. [ cita requerida ]

La barra de herramientas de búsqueda habilita operadores avanzados de palabras clave, utilizando *como carácter comodín . Un par de comillas frente a la búsqueda de una secuencia exacta de palabras clave presentes en el título o en el cuerpo de la página web, mientras que los insite restringe operador a un dominio específico de Internet. [10]

Una vez que se archiva una página web, ningún usuario de Internet puede eliminarla directamente. [11]

Al guardar una lista dinámica , el cuadro de búsqueda archive.today muestra solo un resultado que vincula la sección anterior y la siguiente de la lista (por ejemplo, 20 vínculos por página). [12] Las otras páginas web guardadas se filtran y, a veces, se pueden encontrar por una de sus ocurrencias. [ cita requerida ]

La función de búsqueda está respaldada por Google CustomSearch. Si no ofrece resultados, archive.is intenta utilizar Yandex Search . [ cita requerida ]

Si una página ya ha sido archivada, archive.is le pide al usuario que confirme que ha archivado una nueva revisión, en lugar de archivarla inmediatamente. [ cita requerida ]

Al cargar una página, se muestra una lista de URL a elementos de página individuales entre sus tamaños de contenido, estados HTTP y tipos MIME . Esta lista solo se puede ver durante el proceso de rastreo. [ cita requerida ]

Se pueden descargar las páginas archivadas como un archivo ZIP, excepto las páginas archivadas desde el 29 de noviembre de 2019, cuando Archive.Today cambió su motor de navegador de PhantomJS a Chromium . [13]

Desde julio de 2013, archive.today es compatible con la interfaz de programación de aplicaciones (API) de Memento Project . [14] [15]

Historia [ editar ]

Archive.today se fundó en 2012. El sitio originalmente se denominó archive.today, pero en mayo de 2015, cambió el espejo principal a archive.is. [dieciséis]

En enero de 2019, comenzó a desaprobar el dominio archive.is en favor del espejo archive.today. [17]

Disponibilidad mundial [ editar ]

Australia [ editar ]

En marzo de 2019, el sitio fue bloqueado durante seis meses por varios proveedores de Internet australianos a raíz de los tiroteos en la mezquita de Christchurch en un intento de limitar la distribución de las imágenes del ataque. [18] [19]

China [ editar ]

Según GreatFire .org, archive.today ha estado bloqueado en China desde marzo de 2016, [20] archive.li desde septiembre de 2017, [21] y archive.fo desde julio de 2018. [22]

Finlandia [ editar ]

El 21 de julio de 2015, los operadores bloquearon el acceso al servicio desde todas las direcciones IP finlandesas , indicando en Twitter que lo hicieron para evitar una escalada de una disputa que supuestamente tenían con el gobierno finlandés. [23]

Rusia [ editar ]

En Rusia , solo es posible el acceso HTTP; Las conexiones HTTPS están bloqueadas. [24] [25]

Mundial [ editar ]

Archive.today actualmente bloquea las solicitudes del solucionador de DNS recursivo de Cloudflare , 1.1.1.1 . [26] Archive.today insiste en que los resolutores de DNS recursivos incluyen la geolocalización del usuario que realiza la búsqueda de DNS. Por razones de privacidad, Cloudflare específicamente no incluye la geolocalización del usuario que realiza la solicitud. Como resultado, los servidores DNS de archive.today devuelven intencionalmente respuestas no válidas cuando son consultadas por un solucionador de DNS recursivo de Cloudflare. [27]

Además, desde finales de 2018, Archive.today ha implementado una limitación de límite de datos , presumiblemente para ayudar a proteger contra ataques de denegación de servicio . Los usuarios individuales solo pueden archivar y / o recuperar aproximadamente de 10 a 20 megabytes de datos por día. Una vez que se alcanza esa limitación, su servidor web bloquea la dirección IP del usuario individual al dejar de responder. [ cita requerida ]

Ver también [ editar ]

  • Preservación digital
  • Archivo de Internet
  • Podredumbre de enlaces
    • Wikipedia: Link podrido
  • Perma.cc
  • Wayback Machine
  • Archivo web
  • WebCite

Referencias [ editar ]

  1. ^ Brinkmann, Martin (22 de abril de 2015). "Cree archivos de páginas web disponibles públicamente con Archive.is" . Ghacks . Archivado desde el original el 12 de abril de 2019 . Consultado el 13 de junio de 2015 .
  2. ^ Brunelle, Justin F .; Kelly, Mat; Weigle, Michele C .; Nelson, Michael L. (25 de enero de 2015). "El impacto de JavaScript en la capacidad de archivo" (PDF) . Revista Internacional de Bibliotecas Digitales . 17 (2): 95-117. doi : 10.1007 / s00799-015-0140-8 . S2CID 8433375 . Archivado (PDF) desde el original el 27 de mayo de 2019.  
  3. ^ Dascalescu, Dan (18 de febrero de 2013). "Archivo de páginas web - Wiki de Dan Dascalescu (revisión)" . Wiki.dandascalescu.com. Archivado desde el original el 22 de septiembre de 2013 . Consultado el 3 de octubre de 2013 .
  4. ^ Koebler, Jason (29 de octubre de 2014). "Estimado GamerGate: Por favor, deje de robarnos nuestra mierda" . Placa base . Archivado desde el original el 27 de mayo de 2019 . Consultado el 22 de marzo de 2017 . No hay forma de que un sitio web se proteja de que un usuario de Archive.today refleje el sitio.
  5. ^ "archive.is/faq" . archive.is . Consultado el 15 de febrero de 2019 .
  6. ^ "Página de inicio de Archive.is en 2013" . Archivado desde el original el 12 de enero de 2013. Puede guardar páginas de sitios Web 2.0 incluso con URL hashbang, por ejemplo http://twitter.com/#!/medvedevrussia
  7. ^ "Ejemplo de historial de instantáneas en archive.is" .
  8. ^ Animación de carga generada por JavaScript delvideode Dailymotion que aparece en un estado congelado
  9. ^ "Ejemplo: página guardada de Web Archive en Archive.is" . Archivado desde el original el 20 de mayo de 2013 . Consultado el 23 de octubre de 2019 .
  10. ^ Por ejemplo, la cadena insite: https://en.wikipedia.org "World Cup" devuelve "World + Cup" / instantáneas relacionadas
  11. ^ "Algunas preguntas frecuentes" . archive.is blog . 24 de enero de 2013. Archivado desde el original el 26 de septiembre de 2013 . Consultado el 12 de noviembre de 2018 .
  12. ^ "Ejemplo de lista dinámica recuperada por Worldcat" .
  13. ^ "Blog de Archive.is" . 17 de julio de 2020. Archivado desde el original el 3 de octubre de 2020.
  14. ^ Nelson, Michael L. (9 de julio de 2013). "Archive.is apoya Memento" . Actualizaciones de investigación y docencia . Grupo de Investigación en Ciencias Web y Bibliotecas Digitales en Old Dominion University . Archivado desde el original el 27 de julio de 2013 . Consultado el 17 de septiembre de 2013 .
  15. ^ "archive.is" . Información del protocolo Memento . Memento Development Group. Archivado desde el original el 15 de septiembre de 2013 . Consultado el 17 de septiembre de 2013 .
  16. ^ "¿Por qué cambió la URL de archivo-hoy a archivo-es?" . Blog Archive.is . 3 de mayo de 2015. Archivado desde el original el 1 de junio de 2015 . Consultado el 6 de enero de 2019 .
  17. ^ @archiveis (4 de enero de 2019). "Por favor, no use el espejo archive.IS para vincular, use otros espejos [.TODAY .FO .LI .VN .MD .PH]. .IS podría dejar de funcionar pronto" (Tweet). Archivado desde el original el 6 de enero de 2019, a través de Twitter .
  18. ^ "ISP en AU y NZ comienzan a censurar Internet sin precedentes legales" . Acceso privado a Internet . 19 de marzo de 2019 . Consultado el 20 de marzo de 2019 .
  19. ^ "Los ISP de Nueva Zelanda dicen que están bloqueando sitios que no pueden eliminar el video de filmación de Christchurch" . Gizmodo Australia . 19 de marzo de 2019. Archivado desde el original el 18 de mayo de 2019 . Consultado el 20 de marzo de 2019 .
  20. ^ "archive.is está 100% bloqueado en China" . GreatFire Analyzer . 12 de agosto de 2018. Archivado desde el original el 12 de agosto de 2018.
  21. ^ "archive.li está 100% bloqueado en China" . Gran analizador de incendios . 12 de agosto de 2018. Archivado desde el original el 12 de agosto de 2018.
  22. ^ "archive.fo está 100% bloqueado en China" . Gran analizador de incendios . 12 de agosto de 2018. Archivado desde el original el 12 de agosto de 2018.
  23. ^ Lapintie, Lassi (22 de julio de 2015). "Suomalaisilta estettiin haktivistien suosimalla verkkosivulla käynti" [ Se bloquea el acceso de los finlandeses al sitio web utilizado por los hacktivistas]. Iltalehti (en finlandés). Archivado desde el original el 27 de mayo de 2019 . Consultado el 4 de marzo de 2016 .
  24. ^ Elistratov, Vladimir (29 de enero de 2016). "Roskomnadzor zablokiroval servis archive.is, khranyashchiy kopii veb-saytov"Роскомнадзор заблокировал сервис archive.is, хранящий копии веб-сайтов. TJournal (en ruso). Archivado desde el original el 30 de agosto de 2017 . Consultado el 30 de enero de 2016 .
  25. ^ Cushing, Tim (4 de febrero de 2016). "Rusia bloquea otro sitio de archivo porque podría contener páginas antiguas sobre drogas" . Techdirt . Archivado desde el original el 23 de marzo de 2019 . Consultado el 26 de febrero de 2016 .
  26. ^ @archiveis (15 de julio de 2018). " ' Tener que hacer' no es tan directo aquí. La ausencia de EDNS y la falta de coincidencia masiva (no solo en AS / Country, sino incluso a nivel de continente) de dónde provienen el DNS y las solicitudes HTTP relacionadas causa tantos problemas, por lo que considero EDNS -menos solicitudes de Cloudflare como inválidas " (Tweet) - a través de Twitter .
  27. ^ https://news.ycombinator.com/item?id=19828702

Enlaces externos [ editar ]

  • Página web oficial
  • Blog Archive.is
  • archive.today en Twitter
  • "Las 7 mejores alternativas de Wayback Machine para usar en 2019"