Podredumbre de enlaces


De Wikipedia, la enciclopedia libre
  (Redirigido desde Dead link )
Saltar a navegación Saltar a búsqueda

La descomposición de enlaces (también llamada muerte de enlaces , rotura de enlaces o descomposición de referencias ) es el fenómeno de hipervínculos que, con el tiempo, tienden a dejar de apuntar a su archivo , página web o servidor originalmente objetivo debido a que ese recurso se reubica en una nueva dirección o se convierte en permanentemente no disponible. Un enlace que ya no apunta a su objetivo, a menudo llamado enlace roto o inactivo , es una forma específica de puntero colgante .

La tasa de rotura de enlaces es un tema de estudio e investigación debido a su importancia para la capacidad de Internet para preservar la información. Las estimaciones de esa tasa varían drásticamente entre los estudios.

Predominio

Varios estudios han examinado la prevalencia de la rotura de enlaces dentro de la World Wide Web , en la literatura académica que usa URL para citar contenido web y dentro de las bibliotecas digitales .

Un estudio de 2003 encontró que en la Web, aproximadamente un enlace de cada 200 se rompía cada semana, [1] lo que sugiere una vida media de 138 semanas. Esta tasa fue confirmada en gran medida por un estudio de 2016-2017 sobre enlaces en Yahoo! Directorio (que dejó de actualizarse en 2014 después de 21 años de desarrollo) que encontró que la vida media de los enlaces del directorio era de dos años. [2]

Un estudio de 2004 mostró que los subconjuntos de enlaces web (como los que se dirigen a tipos de archivos específicos o los alojados por una institución académica) podrían tener vidas medias dramáticamente diferentes. [3] Las URL seleccionadas para su publicación parecen tener una mayor longevidad que la URL promedio. Un estudio de 2015 realizado por Weblock analizó más de 180.000 enlaces de referencias en los corpus de texto completo de tres importantes editoriales de acceso abierto y encontró una vida media de aproximadamente 14 años, [4] que generalmente confirma un estudio de 2005 que encontró que la mitad de las URL Los artículos citados en la Revista D-Lib estuvieron activos 10 años después de su publicación. [5]Otros estudios han encontrado tasas más altas de pudrición de eslabones en la literatura académica, pero típicamente sugieren una vida media de cuatro años o más. [6] [7] Un estudio de 2013 en BMC Bioinformatics analizó cerca de 15.000 enlaces en resúmenes del índice de citas Web of Science de Thomson Reuters y descubrió que la vida media de las páginas web era de 9,3 años, y solo el 62% se archivaba. [8] Un estudio de 2021 de enlaces externos en artículos del New York Times de 1996-2019 encontró que el 25% de los enlaces eran inaccesibles. Además, de una muestra de 4.500 enlaces todavía accesibles, el 13% no condujo al contenido original, un fenómeno llamado deriva de contenido. [9]

Un estudio de 2002 sugirió que la descomposición de enlaces dentro de las bibliotecas digitales es considerablemente más lenta que en la web, y encontró que alrededor del 3% de los objetos ya no eran accesibles después de un año [10] (lo que equivale a una vida media de casi 23 años).

Causas

La pudrición del enlace puede resultar de varias ocurrencias. Es posible que se elimine una página web de destino. El servidor que aloja la página de destino podría fallar, retirarse del servicio o reubicarse en un nuevo nombre de dominio . El registro de un nombre de dominio puede caducar o transferirse a otra parte. Algunas causas harán que el enlace no encuentre ningún objetivo y devuelva un error como HTTP 404 . Otras causas harán que un enlace apunte a contenido diferente al que pretendía el autor del enlace.

Otras razones de los enlaces rotos incluyen:

  • la reestructuración de sitios web que provoca cambios en las URL (p. ej., domain.net/pine_treepodría ser trasladado a domain.net/tree/pine)
  • reubicación de contenido anteriormente gratuito detrás de un muro de pago
  • un cambio en la arquitectura del servidor que da como resultado un código como PHP que funciona de manera diferente
  • contenido de página dinámico, como resultados de búsqueda que cambian por diseño
  • la presencia de información específica del usuario (como un nombre de inicio de sesión) dentro del enlace
  • bloqueo deliberado por filtros de contenido o cortafuegos
  • la eliminación de gTLD [11]
  • la expiración del registro de un nombre de dominio

Prevención y detección

Las estrategias para prevenir la descomposición de enlaces pueden centrarse en colocar contenido donde su probabilidad de persistir sea mayor, crear enlaces que tengan menos probabilidades de romperse, tomar medidas para preservar los enlaces existentes o reparar enlaces cuyos objetivos se hayan reubicado o eliminado.

La creación de URL que no cambiarán con el tiempo es el método fundamental para prevenir la descomposición de los enlaces. La planificación preventiva ha sido defendida por Tim Berners-Lee y otros pioneros de la web. [12]

Las estrategias relacionadas con la autoría de los enlaces incluyen:

  • vincular a fuentes primarias en lugar de secundarias y priorizar sitios estables [ cita requerida ]
  • evitar enlaces que apunten a recursos en las páginas personales de los investigadores [5]
  • utilizando URL limpias [13] o empleando la normalización de URL o la canonicalización de URL
  • utilizando enlaces permanentes e identificadores persistentes como ARK, DOI , referencias del sistema de manejo y PURL
  • evitar enlaces a documentos que no sean páginas web [13]
  • evitando los enlaces profundos
  • enlaces a archivos web como Internet Archive , [14] WebCite , [15] Archive.is , Perma.cc , [16] o Amber [17]

Las estrategias relacionadas con la protección de enlaces existentes incluyen:

  • el uso de mecanismos de redirección como HTTP 301 para referir automáticamente los navegadores y rastreadores al contenido reubicado
  • utilizando sistemas de gestión de contenido que pueden actualizar automáticamente los enlaces cuando el contenido dentro del mismo sitio se reubica o reemplaza automáticamente los enlaces con URL canónicas [18]
  • integración de recursos de búsqueda en páginas HTTP 404 [19]

La detección de enlaces rotos se puede realizar de forma manual o automática. Los métodos automatizados incluyen complementos para sistemas de administración de contenido, así como verificadores independientes de enlaces rotos, como Link Sleuth de Xenu . Es posible que la comprobación automática no detecte enlaces que devuelvan un 404 suave o enlaces que devuelvan una respuesta 200 OK pero que señalen contenido que ha cambiado. [20]

Ver también

  • Podredumbre de software
  • Preservación digital
  • Delecionismo e inclusismo en Wikipedia

Otras lecturas

  • Markwell, John; Brooks, David W. (2002). "Enlaces rotos: la naturaleza efímera de los hipervínculos educativos WWW". Revista de Educación Científica y Tecnología . 11 (2): 105–108. doi : 10.1023 / A: 1014627511641 . S2CID  60802264 .
  • Gomes, Daniel; Silva, Mário J. (2006). "Modelado de la persistencia de la información en la Web" (PDF) . Actas del VI Congreso Internacional de Ingeniería Web . ICWE'06. Archivado desde el original (PDF) el 16 de julio de 2011 . Consultado el 14 de septiembre de 2010 .
  • Dellavalle, Robert P .; Hester, Eric J .; Heilig, Lauren F .; Drake, Amanda L .; Kuntzman, Jeff W .; Graber, Marla; Schilling, Lisa M. (2003). "Going, Going, Gone: Referencias perdidas de Internet" . Ciencia . 302 (5646): 787–788. doi : 10.1126 / science.1088234 . PMID  14593153 . S2CID  154604929 .
  • Koehler, Wallace (1999). "Un análisis de la constancia y permanencia de páginas web y sitios web". Revista de la Sociedad Estadounidense de Ciencias de la Información . 50 (2): 162–180. doi : 10.1002 / (SICI) 1097-4571 (1999) 50: 2 <162 :: AID-ASI7> 3.0.CO; 2-B .
  • Sellitto, Carmine (2005). "El impacto de las citas temporales en la Web: un estudio de 123 publicaciones de conferencias académicas" (PDF) . Revista de la Sociedad Estadounidense de Ciencia y Tecnología de la Información . 56 (7): 695–703. CiteSeerX  10.1.1.473.2732 . doi : 10.1002 / asi.20159 .

Notas y referencias

Notas
Referencias
  1. Fetterly, Dennis; Manasse, Mark; Najork, Marc; Wiener, Janet (2003). "Un estudio a gran escala de la evolución de las páginas web" . Actas de la 12ª conferencia internacional sobre World Wide Web . Archivado desde el original el 9 de julio de 2011 . Consultado el 14 de septiembre de 2010 .
  2. van der Graaf, Hans. "La vida media de un enlace es de dos años" . Blog de ZOMDir . Archivado desde el original el 17 de octubre de 2017 . Consultado el 31 de enero de 2019 .
  3. ^ Koehler, Wallace (2004). Continuó el estudio longitudinal de las páginas web: una consideración de la persistencia del documento ” . Investigación de información . 9 (2). Archivado desde el original el 11 de septiembre de 2017 . Consultado el 31 de enero de 2019 .
  4. ^ "Informe de Weblock de todos los tiempos" . Agosto de 2015. Archivado desde el original el 4 de marzo de 2016 . Consultado el 12 de enero de 2016 .
  5. ^ a b McCown, Frank; Chan, Sheffan; Nelson, Michael L .; Bollen, Johan (2005). "La disponibilidad y persistencia de las referencias web en la revista D-Lib" (PDF) . Actas del V Taller Internacional de Archivo Web y Preservación Digital (IWAW'05) . Archivado desde el original (PDF) el 17 de julio de 2012 . Consultado el 12 de octubre de 2005 .
  6. ^ Spinellis, Diomidis (2003). "La decadencia y los fracasos de las referencias web" . Comunicaciones de la ACM . 46 (1): 71–77. CiteSeerX 10.1.1.12.9599 . doi : 10.1145 / 602421.602422 . S2CID 17750450 . Archivado desde el original el 23 de julio de 2020 . Consultado el 29 de septiembre de 2007 .  
  7. ^ Steve Lawrence ; David M. Pennock; Gary William Flake ; et al. (Marzo de 2001). "Persistencia de las referencias web en la investigación científica". Computadora . 34 (3): 26–31. CiteSeerX 10.1.1.97.9695 . doi : 10.1109 / 2.901164 . ISSN 0018-9162 . Wikidata Q21012586 .   
  8. ^ Hennessey, Jason; Xijin Ge, Steven (2013). "Un estudio multidisciplinario de la desintegración del enlace y la eficacia de las técnicas de mitigación" . BMC Bioinformática . 14 : S5. doi : 10.1186 / 1471-2105-14-S14-S5 . PMC 3851533 . PMID 24266891 .  
  9. ^ "Qué significa lo efímero de la Web para sus hipervínculos" . Revista de periodismo de Columbia . Consultado el 2 de agosto de 2021 .
  10. ^ Nelson, Michael L .; Allen, B. Danette (2002). "Persistencia y disponibilidad de objetos en bibliotecas digitales" . Revista D-Lib . 8 (1). doi : 10.1045 / enero de 2002-nelson . Archivado desde el original el 19 de julio de 2020 . Consultado el 24 de septiembre de 2019 .
  11. ^ "La muerte de un TLD" . blog.benjojo.co.uk . Archivado desde el original el 26 de julio de 2018 . Consultado el 27 de julio de 2018 .
  12. ^ Berners-Lee, Tim (1998). "Los URI geniales no cambian" . Archivado desde el original el 2 de marzo de 2000 . Consultado el 31 de enero de 2019 .
  13. ↑ a b Kille, Leighton Walter (8 de noviembre de 2014). "El creciente problema de Internet" Link Rot "y mejores prácticas para medios y editores en línea" . Recursos para periodistas, Harvard Kennedy School. Archivado desde el original el 12 de enero de 2015 . Consultado el 16 de enero de 2015 .
  14. ^ "Archivo de Internet: biblioteca digital de libros, películas, música y Wayback Machine gratuitos" . 2001-03-10. Archivado desde el original el 26 de enero de 1997 . Consultado el 7 de octubre de 2013 .
  15. ^ Eysenbach, Gunther; Trudel, Mathieu (2005). "Yendo, yendo, todavía ahí: Usando el servicio WebCite para archivar permanentemente las páginas web citadas" . Revista de investigación médica en Internet . 7 (5): e60. doi : 10.2196 / jmir.7.5.e60 . PMC 1550686 . PMID 16403724 .  
  16. ^ Zittrain, Jonathan; Albert, Kendra; Lessig, Lawrence (12 de junio de 2014). "Perma: determinación del alcance y tratamiento del problema de enlace y pudrición de referencia en citas legales" (PDF) . Gestión de información legal . 14 (2): 88–99. doi : 10.1017 / S1472669614000255 . S2CID 232390360 . Archivado (PDF) desde el original el 1 de noviembre de 2020 . Consultado el 10 de junio de 2020 .  
  17. ^ "Berkman Center de la Universidad de Harvard lanza ámbar, una herramienta de" ayuda mutua "para bloggers y propietarios de sitios web para ayudar a mantener la Web disponible | Berkman Center" . cyber.law.harvard.edu . Archivado desde el original el 2 de febrero de 2016 . Consultado el 28 de enero de 2016 .
  18. Rønn-Jensen, Jesper (5 de octubre de 2007). "El software elimina los errores del usuario y Linkrot" . Justaddwater.dk. Archivado desde el original el 11 de octubre de 2007 . Consultado el 5 de octubre de 2007 .
  19. Mueller, John (14 de diciembre de 2007). "FYI en las últimas funciones de la barra Google" . Blog central para webmasters de Google. Archivado desde el original el 13 de septiembre de 2008 . Consultado el 9 de julio de 2008 .
  20. ^ Bar-Yossef, Ziv; Broder, Andrei Z .; Kumar, Ravi; Tomkins, Andrew (2004). "Sic transit gloria telae: hacia una comprensión de la decadencia de la Web". Actas de la decimotercera conferencia internacional sobre World Wide Web - WWW '04 . págs. 328–337. CiteSeerX 10.1.1.1.9406 . doi : 10.1145 / 988672.988716 . ISBN  978-1581138443.

enlaces externos

  • Preparar sus URI para el futuro
  • Jakob Nielsen , "Fighting Linkrot" , Alertbox de Jakob Nielsen , 14 de junio de 1998.
Obtenido de " https://en.wikipedia.org/w/index.php?title=Link_rot&oldid=1040326840 "