Página semiprotejada
De Wikipedia, la enciclopedia libre
Ir a navegaciónSaltar a buscar

Un localizador uniforme de recursos ( URL ), denominado coloquialmente una dirección web , [1] es una referencia a un recurso web que especifica su ubicación en una red informática y un mecanismo para recuperarlo. Una URL es un tipo específico de Identificador uniforme de recursos (URI), [2] [3] aunque muchas personas usan los dos términos indistintamente. [4] [a] Las URL ocurren con mayor frecuencia para hacer referencia a páginas web ( http ), pero también se utilizan para transferencia de archivos ( ftp ), correo electrónico ( mailto ), acceso a bases de datos ( JDBC) y muchas otras aplicaciones.

La mayoría de los navegadores web muestran la URL de una página web encima de la página en una barra de direcciones . Una URL típica podría tener la forma http://www.example.com/index.html, que indica un protocolo ( http), un nombre de host ( www.example.com) y un nombre de archivo ( index.html).

Historia

Ejemplo simple del localizador uniforme de recursos

Los localizadores uniformes de recursos fueron definidos en RFC 1738 en 1994 por Tim Berners-Lee , el inventor de la World Wide Web , y el grupo de trabajo URI del Grupo de trabajo de ingeniería de Internet (IETF), [7] como resultado de la colaboración iniciada en el IETF Living Documents sesión de aves de una pluma en 1992. [8] [9] 

El formato combina el sistema preexistente de nombres de dominio (creado en 1985) con la sintaxis de ruta de archivo , donde se utilizan barras para separar directorios y nombres de archivos . Ya existían convenciones en las que los nombres de servidor podían tener un prefijo para completar rutas de archivo, precedidos por una barra doble ( //). [10]

Berners-Lee luego expresó su pesar por el uso de puntos para separar las partes del nombre de dominio dentro de las URI , deseando haber usado barras en todas partes, [10] y también dijo que, dados los dos puntos que siguen al primer componente de una URI, los dos las barras inclinadas antes del nombre de dominio eran innecesarias. [11]

Un primer borrador (1993) de la Especificación HTML [12] se refería a localizadores de recursos "universales". Esto se eliminó en algún momento entre junio de 1994 ( RFC  1630 ) y octubre de 1994 (draft-ietf-uri-url-08.txt). [13]

Sintaxis

Cada URL HTTP se ajusta a la sintaxis de un URI genérico. La sintaxis genérica de URI consta de una secuencia jerárquica de cinco componentes : [14]

URI = esquema: [// autoridad] ruta [? Consulta] [# fragmento]

donde el componente de autoridad se divide en tres subcomponentes :

autoridad = [userinfo @] host [: puerto]

Esto se representa en un diagrama de sintaxis como:

Diagrama de sintaxis de URI

El URI comprende:

  • Un no vacio componente de esquema seguido de dos puntos (:), que consta de una secuencia de caracteres que comienza con una letra y seguida de cualquier combinación de letras, dígitos, más (+), punto (.) o guión (-). Aunque los esquemas no distinguen entre mayúsculas y minúsculas, la forma canónica es en minúsculas y los documentos que especifican esquemas deben hacerlo con letras minúsculas. Ejemplos de esquemas populares incluyenhttp,https,ftp,mailto,file,data, yirc. Los esquemas de URI deben registrarse con laAutoridad de Números Asignados de Internet (IANA), aunque en la práctica se utilizan esquemas no registrados. [B]
  • Un opcional componente de autoridad precedido por dos barras (//), que comprende:
    • Un opcional subcomponente userinfo que puede consistir en unnombre de usuarioy unacontraseñaopcionalprecedidos por dos puntos (:), seguidos de un símbolo arroba (@). El uso del formatousername:passworden el subcomponente userinfo está en desuso por razones de seguridad. Las aplicaciones no deben mostrar como texto claro ningún dato después de los primeros dos puntos (:) que se encuentran dentro de un subcomponente de información de usuario, a menos que los datos después de los dos puntos sean la cadena vacía (que indica que no hay contraseña).
    • A subcomponente de host , que consta de un nombre registrado (que incluye, entre otros, unnombre de host) o unadirección IP. LasdireccionesIPv4deben estar ennotación decimal con puntosylasdireccionesIPv6deben estar entre corchetes ([]). [16] [c]
    • Un opcional subcomponente de puerto precedido por dos puntos (:).
  • A componente de ruta , que consta de una secuencia de segmentos de ruta separados por una barra inclinada (/). Siempre se define una ruta para un URI, aunque la ruta definida puede estar vacía (longitud cero). Un segmento también puede estar vacío, lo que da como resultado dos barras diagonales consecutivas (//) en el componente de ruta. Un componente de ruta puede parecerse o correlacionarse exactamente con unaruta del sistema de archivos, pero no siempre implica una relación con uno. Si hay un componente de autoridad, entonces el componente de ruta debe estar vacío o comenzar con una barra inclinada (/). Si un componente de autoridad está ausente, entonces la ruta no puede comenzar con un segmento vacío, es decir, con dos barras (//), ya que los siguientes caracteres se interpretarían como un componente de autoridad. [18]El segmento final de la ruta puede denominarse " slug ".
  • Un opcional componente de consulta precedido por un signo de interrogación (?), que contiene unacadenadeconsultade datos no jerárquicos. Su sintaxis no está bien definida, pero por convención suele ser una secuencia depares atributo-valorseparados por undelimitador.
  • Un opcional componente de fragmento precedido por unhash(#). El fragmento contiene unidentificador de fragmento queproporciona dirección a un recurso secundario, como un encabezado de sección en un artículo identificado por el resto del URI. Cuando el recurso principal es undocumentoHTML, el fragmento suele ser unidatributode un elemento específico, y los navegadores web desplazarán este elemento a la vista.

Un navegador web normalmente eliminará la referencia a una URL realizando una solicitud HTTP al host especificado, de forma predeterminada en el puerto número 80. Las URL que utilizan el httpsesquema requieren que las solicitudes y respuestas se realicen a través de una conexión segura al sitio web .

URL internacionalizada

Los usuarios de Internet están distribuidos por todo el mundo utilizando una amplia variedad de idiomas y alfabetos y esperan poder crear URL en sus propios alfabetos locales. Un identificador de recursos internacionalizado (IRI) es una forma de URL que incluye caracteres Unicode. Todos los navegadores modernos admiten IRI. Las partes de la URL que requieren un tratamiento especial para diferentes alfabetos son el nombre de dominio y la ruta. [20] [21]

El nombre de dominio en el IRI se conoce como un nombre de dominio internacionalizado (IDN). El software web y de Internet convierte automáticamente el nombre de dominio en un código pequeño que puede utilizar el Sistema de nombres de dominio; por ejemplo, la URL china se http://例子.卷筒纸convierte en http://xn--fsqu00a.xn--3lr804guic/. El xn--indica que el carácter no era originalmente ASCII. [22]

El usuario también puede especificar el nombre de la ruta URL en el sistema de escritura local. Si aún no está codificado, se convierte a UTF-8 y los caracteres que no forman parte del conjunto de caracteres de la URL básica se escapan como hexadecimales mediante la codificación porcentual ; por ejemplo, la URL japonesa se http://example.com/引き割り.htmlconvierte en http://example.com/%E5%BC%95%E3%81%8D%E5%89%B2%E3%82%8A.html. La computadora de destino decodifica la dirección y muestra la página. [20]

URL relativas al protocolo

Los enlaces relativos al protocolo (PRL), también conocidos como URL relativos al protocolo (PRURL), son URL que no tienen ningún protocolo especificado. Por ejemplo, //example.comutilizará el protocolo de la página actual, normalmente HTTP o HTTPS. [23] [24]

Ver también

  • Hipervínculo
  • PURL : URL persistente
  • CURIE (URI compacto)
  • Identificador de fragmento
  • Localizador de recursos de Internet (IRL)
  • Identificador de recurso internacionalizado (IRI)
  • URL semántica
  • Typosquatting
  • Identificador uniforme de recursos
  • Normalización de URL
  • Uso de barras diagonales en redes

Notas

  1. ^ Una URL implica los medios para acceder a un recurso indicado y se indica mediante un protocolo o un mecanismo de acceso, lo que no es cierto para todos los URI. [5] [4] Porhttp://www.example.comlotanto,es una URL, mientraswww.example.comque no lo es. [6]
  2. ^ Los procedimientos para registrar nuevos esquemas de URI se definieron originalmente en 1999 por RFC 2717 , y ahora están definidos porRFC  7595 , publicado en junio de 2015. [15] 
  3. ^ Para los URI relacionados con recursos en la World Wide Web, algunos navegadores web permiten.0eliminar porciones de notación decimal con puntos o utilizar direcciones IP enteras sin procesar. [17]
  4. ^ Histórico RFC 1866 (obsoleto porRFC  2854 ) anima a los autores CGI a apoyar ';' además de '&'. [19] 

Citas

  1. ^ W3C (2009) .
  2. ^ "Adelante y barras invertidas en URL" . zzz.buzz . Consultado el 19 de septiembre de 2018 .
  3. ^ RFC 3986 (2005) .
  4. ^ a b Grupo de interés de planificación conjunta W3C / IETF URI (2002) .
  5. ^ RFC 2396 (1998) .
  6. ^ Miessler, Daniel. "La diferencia entre URL y URI" .
  7. ^ W3C (1994) .
  8. ^ IETF (1992) .
  9. ^ Berners-Lee (1994) .
  10. ↑ a b Berners-Lee (2000) .
  11. ^ BBC News (2009) .
  12. ^ Berners-Lee, Tim ; Connolly, Daniel "Dan" (marzo de 1993). Lenguaje de marcado de hipertexto (borrador RFCxxx) (Informe técnico). pag. 28.
  13. ^ Berners-Lee, Tim ; Maestro, Larry ; McCahill, Mark Perry (octubre de 1994). Localizadores uniformes de recursos (URL) (informe técnico).citado en Ang, CS; Martin, DC (enero de 1995). Componente constituyente Interface ++ (Informe técnico). Biblioteca y Centro de Gestión del Conocimiento de UCSF.
  14. ^ RFC 3986, sección 3 (2005) .
  15. ^ IETF (2015) .
  16. ^ RFC 3986 (2005) , §3.2.2.
  17. Lawrence (2014) .
  18. ^ RFC 2396 (1998) , §3.3.
  19. ^ RFC 1866 (1995) , §8.2.1.
  20. ↑ a b W3C (2008) .
  21. ^ W3C (2014) .
  22. ^ IANA (2003) .
  23. ^ Glaser, JD (2013). Desarrollo seguro para aplicaciones móviles: cómo diseñar y codificar aplicaciones móviles seguras con PHP y JavaScript . Prensa CRC . pag. 193. ISBN 978-1-48220903-7. Consultado el 12 de octubre de 2015 .
  24. ^ Schafer, Steven M. (2011). Biblia HTML, XHTML y CSS . John Wiley e hijos . pag. 124. ISBN 978-1-11808130-3. Consultado el 12 de octubre de 2015 .

Referencias

  • "Berners-Lee" lo siento "por las barras" . BBC News . 2009-10-14 . Consultado el 14 de febrero de 2010 .
  • "Living Documents BoF Minutes" . Consorcio World Wide Web . 1992-03-18 . Consultado el 26 de diciembre de 2011 .
  • Berners-Lee, Tim (21 de marzo de 1994). "Localizadores de recursos uniformes (URL): una sintaxis para la expresión de información de acceso de objetos en la red" . Consorcio World Wide Web . Consultado el 13 de septiembre de 2015 .
  • Berners-Lee, Tim ; Maestro, Larry ; McCahill, Mark Perry (agosto de 1998). Localizadores uniformes de recursos (URL) . doi : 10.17487 / RFC1738 . RFC 1738 . Consultado el 31 de agosto de 2015 .
  • Berners-Lee, Tim (2015) [2000]. "¿Por qué //, #, etc.?" . Preguntas frecuentes . Consorcio World Wide Web . Consultado el 3 de febrero de 2010 .
  • Connolly, Daniel "Dan" ; Sperberg-McQueen, C. Michael , eds. (21 de mayo de 2009). "Direcciones web en HTML 5" . Consorcio World Wide Web . Consultado el 13 de septiembre de 2015 .
  • Autoridad de Números Asignados de Internet (2003-02-14). "Finalización de la selección de IANA del prefijo IDNA" . IETF-Anunciar lista de correo . Archivado desde el original el 8 de diciembre de 2004 . Consultado el 3 de septiembre de 2015 .
  • Berners-Lee, Tim ; Fielding, Roy T .; Masinter, Larry (agosto de 1998). Identificadores uniformes de recursos (URI): sintaxis genérica . doi : 10.17487 / RFC2396 . RFC 2396 . Consultado el 31 de agosto de 2015 .
  • Hansen, Tony; Hardie, Ted (junio de 2015). Thaler, Dave (ed.). Directrices y procedimientos de registro para esquemas URI . doi : 10.17487 / RFC7595 . RFC 7595 .
  • Mealling, Michael ; Denenberg, Ray, eds. (Agosto de 2002). Informe del Grupo de interés de planificación conjunta de URI del W3C / IETF: identificadores uniformes de recursos (URI), URL y nombres uniformes de recursos (URN): aclaraciones y recomendaciones . doi : 10.17487 / RFC3305 . RFC 3305 . Consultado el 13 de septiembre de 2015 .
  • Berners-Lee, Tim ; Fielding, Roy T .; Masinter, Larry (enero de 2005). Identificadores uniformes de recursos (URI): sintaxis genérica . doi : 10.17487 / RFC3986 . RFC 3986 . Consultado el 31 de agosto de 2015 .
  • "Introducción a las direcciones web multilingües" . 2008-05-09 . Consultado el 11 de enero de 2015 .
  • Phillip, A. (2014). "Qué está pasando con las" URL internacionales " " . Consorcio World Wide Web . Consultado el 11 de enero de 2015 .
  • Lawrence, Eric. "Browser Arcana: Literales IP en URL" . docs.microsoft.com . Archivado desde el original el 22 de junio de 2020 . Consultado el 22 de junio de 2020 .

enlaces externos

  • Especificación de URL en WHATWG
  • Los componentes de una URL de IBM