El mensaje de error HTTP 404 , 404 No encontrado , 404 , 404 Error , Página no encontrada o Archivo no encontrado es un código de respuesta estándar del Protocolo de transferencia de hipertexto (HTTP) , en las comunicaciones de la red informática , para indicar que el navegador pudo comunicarse con un servidor dado , pero el servidor no pudo encontrar lo que se solicitó. El error también se puede utilizar cuando un servidor no desea revelar si tiene la información solicitada. [1]
El servidor de alojamiento del sitio web generalmente generará una página web "404 No encontrado" cuando un usuario intente seguir un enlace roto o inactivo ; por lo tanto, el error 404 es uno de los errores más reconocibles que se encuentran en la World Wide Web .
Descripción general
Cuando se comunica a través de HTTP, se requiere que un servidor responda a una solicitud, como una solicitud del navegador web para una página web , con un código de respuesta numérico y un mensaje opcional, obligatorio o no permitido (según el código de estado). En el código 404, el primer dígito indica un error del cliente, como un localizador uniforme de recursos (URL) mal escrito . Los siguientes dos dígitos indican el error específico encontrado. El uso de HTTP de códigos de tres dígitos es similar al uso de dichos códigos en protocolos anteriores como FTP y NNTP . En el nivel HTTP, un código de respuesta 404 va seguido de una "frase de motivo" legible por humanos. La especificación HTTP sugiere la frase "No encontrado" [2] y muchos servidores web emiten de forma predeterminada una página HTML que incluye tanto el código 404 como la frase "No encontrado".
A menudo, se devuelve un error 404 cuando las páginas se han movido o eliminado. En el primer caso, es mejor emplear la asignación de URL o la redirección de URL devolviendo una respuesta 301 Moved Permanently, que se puede configurar en la mayoría de los archivos de configuración del servidor, o mediante la reescritura de URL ; en el segundo caso, se debe devolver un 410 Gone. Debido a que estas dos opciones requieren una configuración especial del servidor, la mayoría de los sitios web no las utilizan.
Los errores 404 no deben confundirse con los errores de DNS , que aparecen cuando la URL proporcionada hace referencia a un nombre de servidor que no existe. Un error 404 indica que se encontró el servidor en sí, pero que el servidor no pudo recuperar la página solicitada.
Errores suaves 404
Algunos sitios web informan de un error "no encontrado" al devolver una página web estándar con un código de respuesta "200 OK", informando falsamente que la página se cargó correctamente; esto se conoce como un 404 suave . El término "404 suave" fue introducido en 2004 por Ziv Bar-Yossef et al . [3]
Los Soft 404 son problemáticos para los métodos automatizados de descubrir si un enlace está roto. Algunos motores de búsqueda, como Yahoo y Google , utilizan procesos automatizados para detectar errores 404 suaves. [4] Soft 404s pueden ocurrir como resultado de errores de configuración cuando se usa cierto software de servidor HTTP, por ejemplo con el software Apache , cuando se especifica un documento de error 404 (especificado en un archivo .htaccess ) como una ruta absoluta (por ejemplo, http: //example.com/error.html) en lugar de una ruta relativa (/error.html). [5] Esto también se puede hacer a propósito para obligar a algunos navegadores (como Internet Explorer ) a mostrar un mensaje de error 404 personalizado en lugar de reemplazar lo que se muestra con un mensaje de error "amigable" específico del navegador (en Internet Explorer, este comportamiento es se activa cuando se sirve un 404 y el HTML recibido es más corto que una cierta longitud, y el usuario puede deshabilitarlo manualmente).
También hay errores "suaves 3XX" en los que el contenido se devuelve con un estado 200 pero proviene de una página redirigida, como cuando las páginas que faltan se redirigen a la raíz del dominio / página de inicio.
Servidores proxy
Algunos servidores proxy generan un error 404 cuando un código de error de rango 500 sería más correcto. Si el servidor proxy no puede satisfacer una solicitud de una página debido a un problema con el host remoto (como fallas en la resolución del nombre de host o conexiones TCP rechazadas), esto debería describirse como un error interno del servidor 5xx, pero podría entregar un 404 en su lugar . Esto puede confundir a los programas que esperan y actúan sobre respuestas específicas, ya que ya no pueden distinguir fácilmente entre un servidor web ausente y una página web que falta en un servidor web que está presente.
404 intencionales
En julio de 2004, el proveedor de telecomunicaciones del Reino Unido BT Group implementó el sistema de bloqueo de contenido Cleanfeed , que devuelve un error 404 a cualquier solicitud de contenido identificado como potencialmente ilegal por Internet Watch Foundation . [6] Otros ISP devuelven un error HTTP 403 "prohibido" en las mismas circunstancias. [7] También se ha informado en Tailandia [8] y Túnez de la práctica de emplear falsos errores 404 como medio para ocultar la censura . [9] En Túnez, donde la censura era severa antes de la revolución de 2011 , la gente se dio cuenta de la naturaleza de los falsos errores 404 y creó un personaje imaginario llamado " Ammar 404 " que representa "el censor invisible". [10]
Códigos de error de subestado 404 de Microsoft Internet Server
El software de servidor web desarrollado por Microsoft, Internet Information Services (IIS) de Microsoft, devuelve un conjunto de códigos de subestado con sus respuestas 404. Los códigos de subestado toman la forma de números decimales adjuntos al código de estado 404. Los códigos de subestado no son reconocidos oficialmente por la IANA y no son devueltos por los servidores no son de Microsoft.
Códigos de subestado
Los servidores IIS 7.0, IIS 7.5 e IIS 8.0 de Microsoft definen los siguientes códigos de subestado HTTP para indicar una causa más específica de un error 404:
- 404.0 - No encontrado.
- 404.1 - Sitio no encontrado.
- 404.2 - Restricción ISAPI o CGI .
- 404.3 - Restricción de tipo MIME .
- 404.4 - No se ha configurado ningún controlador.
- 404.5 - Denegado por configuración de filtrado de solicitudes.
- 404.6 - Verbo denegado.
- 404.7 - Extensión de archivo denegada.
- 404.8 - Espacio de nombres oculto.
- 404.9 - Atributo de archivo oculto.
- 404.10 - Encabezado de solicitud demasiado largo.
- 404.11 - La solicitud contiene una secuencia de escape doble.
- 404.12: la solicitud contiene caracteres de bits altos.
- 404.13 - La longitud del contenido es demasiado grande.
- 404.14 - La URL de la solicitud es demasiado larga.
- 404.15 - Cadena de consulta demasiado larga.
- 404.16 - Solicitud de DAV enviada al controlador de archivos estáticos.
- 404.17 - Contenido dinámico asignado al controlador de archivos estáticos mediante una asignación MIME comodín.
- 404.18 - Se ha denegado la secuencia de la cadena de consulta.
- 404.19 - Denegado por regla de filtrado.
- 404.20 - Demasiados segmentos de URL.
Páginas de error personalizadas
Por lo general, los servidores web se pueden configurar para mostrar una página de error 404 personalizada, que incluye una descripción más natural, la marca del sitio principal y, a veces, un mapa del sitio, un formulario de búsqueda o un widget de página 404. La frase de nivel de protocolo, que está oculta al usuario, rara vez se personaliza. Internet Explorer , sin embargo, no mostrará páginas personalizadas a menos que tengan más de 512 bytes, optando en su lugar por mostrar una página de error "amigable". [11] Google Chrome incluyó una funcionalidad similar, donde el 404 se reemplaza con sugerencias alternativas generadas por algoritmos de Google, si la página tiene menos de 512 bytes de tamaño. [ cita requerida ] Otro problema es que si la página no proporciona un favicon , y existe una página 404 personalizada separada, se generará tráfico adicional y tiempos de carga más largos en cada vista de página. [12] [13]
Muchas organizaciones utilizan las páginas de error 404 como una oportunidad para inyectar humor en lo que de otro modo podría ser un sitio web serio. Por ejemplo, Metro UK muestra un oso polar en una patineta, y la agencia de desarrollo web Left Logic tiene un programa de dibujo simple. [14] Durante la campaña de las elecciones generales del Reino Unido de 2015 , los principales partidos políticos utilizaron sus 404 páginas para apuntar a los oponentes políticos o mostrar políticas relevantes a posibles partidarios. [15] En Europa, el proyecto NotFound , creado por varias organizaciones europeas, incluidas Missing Children Europe y Child Focus , anima a los operadores del sitio a añadir un fragmento de código para publicar páginas de error 404 personalizadas [16] que proporcionan datos sobre niños desaparecidos . [17]
Si bien muchos sitios web envían información adicional en un mensaje de error 404, como un enlace a la página de inicio de un sitio web o un cuadro de búsqueda, algunos también se esfuerzan por encontrar la página web correcta que el usuario deseaba. Hay extensiones disponibles para algunos sistemas de administración de contenido (CMS) para hacer esto. [18]
Seguimiento de errores 404
Existen varias herramientas que rastrean a través de un sitio web para encontrar páginas que devuelven códigos de estado 404. Estas herramientas pueden resultar útiles para encontrar enlaces que existan dentro de un sitio web en particular. La limitación de estas herramientas es que solo encuentran enlaces dentro de un sitio web en particular e ignoran los 404 resultantes de enlaces en otros sitios web. Como resultado, estas herramientas pierden el 83% de los 404 en los sitios web. [19] Una forma de evitar esto es encontrar errores 404 mediante el análisis de enlaces externos. [20]
Una de las formas más efectivas de descubrir errores 404 es utilizando Google Search Console , Google Analytics o un software de rastreo.
Otro método común es rastrear el tráfico a las páginas 404 mediante el análisis de archivos de registro. [21] Esto puede ser útil para comprender más sobre lo que alcanzaron los usuarios de 404 en el sitio. Otro método para rastrear el tráfico a las páginas 404 es usar herramientas de rastreo de tráfico basadas en JavaScript. [22]
Ver también
- Pantalla azul de muerte
- Almacenamiento en caché funky
- Podredumbre de enlaces
- Lista de códigos de estado HTTP
Referencias
- ^ "RFC 7231, HTTP / 1.1 semántica y contenido, sección 6.5.4 404 no encontrado" . ietf.org. Junio de 2014 . Consultado el 13 de diciembre de 2018 .
- ^ "RFC 7231, HTTP / 1.1 Semántica y contenido, Sección 6.5.4 404 No encontrado" . ietf.org. Junio de 2014 . Consultado el 13 de diciembre de 2018 .
- ^ Ziv Bar-Yossef; Andrei Z. Broder; Ravi Kumar; Andrew Tompkins (2004). Sic Transit Gloria Telae: Hacia una comprensión del deterioro de la Web . Actas de la 13ª Conferencia Internacional sobre World Wide Web (WWW) . págs. 328–337. doi : 10.1145 / 988672.988716 . ISBN 978-1581138443.
- ^ "¿Por qué su rastreador solicita URL extrañas que nunca han existido en mi sitio?" . Página de ayuda de Yahoo Ysearch. Archivado desde el original el 15 de julio de 2014 . Consultado el 4 de septiembre de 2013 .
- ^ "Adiós a los 404 suaves" . Blog oficial de Google . Consultado el 20 de septiembre de 2008 .
- ^ "Asuntos Públicos LINX» Cleanfeed: los hechos " . Publicaffair.linx.net. 10 de septiembre de 2004. Archivado desde el original el 13 de mayo de 2011 . Consultado el 6 de marzo de 2011 .
- ^ "DEMON - Error 403" . Consultado el 14 de junio de 2012 .
- ^ Sambandaraksa, Don (18 de febrero de 2009). "La vieja rutina falsa '404 no encontrado' - Enlace muerto" . Bangkok Post . Consultado el 12 de septiembre de 2010 .
- ^ Noman, Helmi (12 de septiembre de 2008). "Periodista tunecino demanda a la agencia gubernamental por bloquear Facebook, reclama daños por el uso del mensaje de error 404 en lugar del 403" . Iniciativa Red Abierta . Consultado el 21 de noviembre de 2010 .
- ^ "Movimiento contra la censura en Túnez: ¡creatividad, coraje y esperanza!" . Defensa de Global Voices. 27 de mayo de 2010 . Consultado el 28 de agosto de 2010 .
- ^ "Páginas de error HTTP amigables" . msdn.com. 18 de agosto de 2010. Archivado desde el original el 2 de diciembre de 2010 . Consultado el 14 de junio de 2012 .
- ^ Heng, Christopher (7 de septiembre de 2008). "¿Qué es Favicon.ico y cómo crear un icono de Favicon para su sitio web?" . El asistente del sitio . Consultado el 23 de febrero de 2011 .
- ^ "The Dastardly" favicon.ico no encontrado "Error" . Gente de Internet . 3 de agosto de 1999.
- ^ "De osos patinadores a niños desaparecidos: el poder de la página de error 404 Not Found" . Metro. 6 de junio de 2011 . Consultado el 16 de abril de 2013 .
- ^ "La guerra política" . BBC Newsbeat . 27 de abril de 2015 . Consultado el 18 de mayo de 2018 .
- ^ "Notfound.org" . no encontrado . extraviado. Archivado desde el original el 2 de septiembre de 2014.
- ^ "Los mensajes de niños perdidos van en las páginas de error 404" . BBC News . 27 de septiembre de 2012 . Consultado el 20 de septiembre de 2014 .
- ^ Swenson, Sahala (19 de agosto de 2008). "Haga que sus páginas 404 sean más útiles" . Blog oficial del Centro para webmasters de Google . Google, Inc . Consultado el 28 de agosto de 2009 .
- ^ "Fuentes que conducen a 404" . SpringTrax . Consultado el 11 de febrero de 2013 .
- ^ Cushing, Anne (2 de abril de 2013). "Un enfoque centrado en los datos para identificar 404 páginas que vale la pena guardar" . Search Engine Land . Consultado el 7 de junio de 2013 .
- ^ "Seguimiento y prevención de errores 404" . 404errorpages.com . Consultado el 7 de junio de 2013 .
- ^ "Comprender los errores 404" . SpringTrax.com . Consultado el 7 de junio de 2013 .
enlaces externos
- Un 404 más útil
- 404 No encontrado del Protocolo de transferencia de hipertexto (HTTP / 1.1): Especificación de semántica y contenido , en el Grupo de trabajo de ingeniería de Internet
- Directiva ErrorDocument : instrucciones sobre páginas de error personalizadas para el servidor web Apache 2.0
- 404: Not Found : una canción premiada sobre el código de error