Caché del motor de búsqueda

La caché del motor de búsqueda es una caché de páginas web que muestra la página como estaba cuando fue indexada por un rastreador web . Las versiones en caché de las páginas web se pueden utilizar para ver el contenido de una página cuando no se puede acceder a la versión en vivo, se ha alterado o eliminado. ^[1]

El enlace para la versión en caché de una página web en los resultados de búsqueda de Google (arriba), Bing (medio) y Yandex (abajo)

Cuando un rastreador web rastrea la web, recopila el contenido de cada página para permitir que el motor de búsqueda la indexe . Al mismo tiempo, puede almacenar una copia de esa página. El motor de búsqueda puede hacer que la copia sea accesible para los usuarios en los resultados del motor de búsqueda. Los rastreadores web que obedezcan las restricciones dadas en robots.txt ^[2] o metaetiquetas ^[3] por parte del webmaster no pueden poner una copia en caché a disposición de los usuarios del motor de búsqueda si se les indica que no lo hagan.

La caché del motor de búsqueda se puede utilizar para la investigación de delitos , ^[4] procedimientos legales ^[5] y periodismo . ^[6]^[1] Ejemplos de motores de búsqueda que ofrecen a sus usuarios versiones en caché de páginas web son Google Search , Bing , Yandex Search y Baidu .

Es posible que la caché del motor de búsqueda no esté completamente protegida por las leyes habituales que protegen a los proveedores de tecnología de las reclamaciones por infracción de derechos de autor. ^[7]

Referencias

↑ ^a ^b Wilfried Ruetten (2012). El manual de periodismo de datos . O'Reilly Media, Inc. ISBN 9781449330064. Cuando una página se vuelve controvertida, los editores pueden eliminarla o alterarla sin reconocimiento. Si sospecha que se está encontrando con el problema, el primer lugar al que debe acudir es el caché de la página de Google tal como estaba cuando hizo su último rastreo.
^ "Especificaciones de metaetiqueta de robots, data-nosnippet y X-Robots-Tag" . noarchive: no muestra un enlace almacenado en caché en los resultados de búsqueda.
^ "Etiquetas especiales que comprende Google - Ayuda de Search Console" . noarchive: no muestra un enlace en caché para una página en los resultados de búsqueda.
^ Todd G. Shipley, Art Bowker (2013). Investigación de crímenes en Internet: Introducción a la resolución de crímenes en el ciberespacio . Newnes. ISBN 9780124079298. Para el investigador, esto puede ser una información valiosa. Dependiendo de cuándo Google rastreó el sitio, la última página puede contener información diferente a la página actual. Por lo tanto, documentar y capturar la página en caché de Google de una página web puede ser un paso importante para garantizar que se conserve esta instantánea de tiempo.
^ Steven Mark Levy (2011). Regulación de Valores: Libro de Respuestas de la SEC . Editores de Aspen en línea. ISBN 9781454805434. La World Wide Web no es tan efímera como podría pensarse. Un número cada vez mayor de páginas web antiguas están disponibles en línea a través de servicios como Wayback Machine, Google Cache, Yahoo Cache o Bing Cache. Los abogados de algunos demandantes y los tábanos corporativos utilizan estos servicios como una cuestión de rutina.
^ Cleland Thom (23 de octubre de 2014). "Los cachés de Google y el motor de búsqueda .com brindan soluciones de 'derecho al olvido'" . Presione Gaceta . Los periodistas también pueden acceder a contenido eliminado de la lista a través de la caché de Google.
^ Herman De Bauw, Valerie Vandenweghe (junio de 2011). "Tribunal de apelación de Bruselas confirma sentencia contra Google News y Google Cache" . Archivado desde el original el 26 de abril de 2015. Para la función de caché, el Tribunal rechazó la excepción de una "copia técnicamente necesaria". Esta excepción exime la reproducción temporal que es parte necesaria de un proceso técnico aplicado por un intermediario para la transmisión en una red entre terceros. Según el Tribunal, la copia caché que Google almacena en su servidor no es técnicamente necesaria para una transmisión eficiente.

Este artículo relacionado con la World Wide Web es un fragmento . Puedes ayudar a Wikipedia expandiéndolo .

[journalismhandbook-1] Wilfried Ruetten (2012). El manual de periodismo de datos . O'Reilly Media, Inc. ISBN 9781449330064. Cuando una página se vuelve controvertida, los editores pueden eliminarla o alterarla sin reconocimiento. Si sospecha que se está encontrando con el problema, el primer lugar al que debe acudir es el caché de la página de Google tal como estaba cuando hizo su último rastreo.

[2] "Especificaciones de metaetiqueta de robots, data-nosnippet y X-Robots-Tag" . noarchive: no muestra un enlace almacenado en caché en los resultados de búsqueda.

[3] "Etiquetas especiales que comprende Google - Ayuda de Search Console" . noarchive: no muestra un enlace en caché para una página en los resultados de búsqueda.

[4] Todd G. Shipley, Art Bowker (2013). Investigación de crímenes en Internet: Introducción a la resolución de crímenes en el ciberespacio . Newnes. ISBN 9780124079298. Para el investigador, esto puede ser una información valiosa. Dependiendo de cuándo Google rastreó el sitio, la última página puede contener información diferente a la página actual. Por lo tanto, documentar y capturar la página en caché de Google de una página web puede ser un paso importante para garantizar que se conserve esta instantánea de tiempo.

[5] Steven Mark Levy (2011). Regulación de Valores: Libro de Respuestas de la SEC . Editores de Aspen en línea. ISBN 9781454805434. La World Wide Web no es tan efímera como podría pensarse. Un número cada vez mayor de páginas web antiguas están disponibles en línea a través de servicios como Wayback Machine, Google Cache, Yahoo Cache o Bing Cache. Los abogados de algunos demandantes y los tábanos corporativos utilizan estos servicios como una cuestión de rutina.

[pressgazette-6] Cleland Thom (23 de octubre de 2014). "Los cachés de Google y el motor de búsqueda .com brindan soluciones de 'derecho al olvido'" . Presione Gaceta . Los periodistas también pueden acceder a contenido eliminado de la lista a través de la caché de Google.

[eubelius-7] Herman De Bauw, Valerie Vandenweghe (junio de 2011). "Tribunal de apelación de Bruselas confirma sentencia contra Google News y Google Cache" . Archivado desde el original el 26 de abril de 2015. Para la función de caché, el Tribunal rechazó la excepción de una "copia técnicamente necesaria". Esta excepción exime la reproducción temporal que es parte necesaria de un proceso técnico aplicado por un intermediario para la transmisión en una red entre terceros. Según el Tribunal, la copia caché que Google almacena en su servidor no es técnicamente necesaria para una transmisión eficiente.

[1]