HTML semántico es el uso de marcado HTML para reforzar la semántica , o el significado, de la información en páginas web y aplicaciones web en lugar de simplemente definir su presentación o apariencia . El HTML semántico es procesado por los navegadores web tradicionales , así como por muchos otros agentes de usuario . CSS se utiliza para sugerir su presentación a usuarios humanos.
Historia
HTML ha incluido marcado semántico desde sus inicios. [1] En un documento HTML, el autor puede, entre otras cosas, "comenzar con un título; agregar encabezados y párrafos; agregar énfasis al texto; agregar imágenes; agregar enlaces a otras páginas; [y] usar varios tipos de listas ". [2]
Varias versiones del estándar HTML han incluido marcas de presentación como (agregado en HTML 3.2; eliminado en HTML 4.0 Strict),
(todas las versiones) y
(agregado en HTML 3.2). También están los elementos span y div semánticamente neutros . Desde finales de la década de 1990, cuando las hojas de estilo en cascada comenzaban a funcionar en la mayoría de los navegadores, se ha alentado a los autores web a evitar el uso de marcado HTML de presentación con vistas a la separación de la presentación y el contenido . [3]
En 2001, Tim Berners-Lee participó en una discusión sobre la Web Semántica , donde se presentó que los 'agentes' de software inteligente podrían algún día rastrear automáticamente la Web y encontrar, filtrar y correlacionar hechos publicados previamente no relacionados en beneficio de los usuarios finales. . [4] Estos agentes no son comunes incluso ahora, pero algunas de las ideas de Web 2.0 , mashups y sitios web de comparación de precios pueden estar acercándose. La principal diferencia entre estos híbridos de aplicaciones web y los agentes semánticos de Berners-Lee radica en el hecho de que la actual agregación e hibridación de información suele estar diseñada por desarrolladores web, que ya conocen las ubicaciones web y la semántica API de los datos específicos que desean. para triturar, comparar y combinar.
Un tipo importante de agente web que rastrea y lee páginas web automáticamente, sin conocimiento previo de lo que puede encontrar, es el rastreador web o la araña del motor de búsqueda. Estos agentes de software dependen de la claridad semántica de las páginas web que encuentran, ya que utilizan diversas técnicas y algoritmos para leer e indexar millones de páginas web al día y proporcionar a los usuarios de la web servicios de búsqueda .
Para que las arañas de los motores de búsqueda puedan calificar la importancia de fragmentos de texto que encuentran en documentos HTML, y también para aquellos que crean mashups y otros híbridos, así como para agentes más automatizados a medida que se desarrollan, las estructuras semánticas que existen en HTML deben aplicarse amplia y uniformemente para resaltar el significado de la información publicada. [5]
Si bien la verdadera web semántica puede depender de ontologías y metadatos RDF complejos , cada documento HTML contribuye al significado de la Web mediante el uso correcto de encabezados, listas, títulos y otras marcas semánticas siempre que sea posible. Este uso "simple" de HTML se ha denominado "HTML semántico simple y antiguo" o POSH. [6] El uso correcto del 'etiquetado' de la Web 2.0 crea folksonomías que pueden ser igualmente significativas o incluso más significativas para muchos. [5] HTML 5 introduce nuevos elementos semánticos tales como , , , , , , , y . [7] En general, el objetivo del W3C es introducir lentamente más formas para que los navegadores, desarrolladores y rastreadores distingan mejor entre diferentes tipos de datos, lo que permite beneficios como una mejor visualización en navegadores en diferentes dispositivos. section
article
footer
progress
nav
aside
mark
time
Los elementos de presentación no se desaprobaron formalmente en las recomendaciones de HTML 4.01 y XHTML, pero no se recomendaron. En HTML 5, algunos de esos elementos, como i
y b
todavía se especifican, ya que su significado se ha definido claramente "para que se desvíen estilísticamente de la prosa normal sin transmitir ninguna importancia adicional". [8] [9]
Consideraciones
En los casos en que un documento requiera una semántica más precisa que la expresada solo en HTML, se pueden incluir fragmentos del documento span
o div
elementos con nombres de clase significativos [10] como y
. Cuando estos nombres de clase también son un identificador de fragmentos dentro de un esquema u ontología, pueden vincularse a un significado más definido. Los microformatos formalizan este enfoque de la semántica en HTML.
Una restricción importante de este enfoque es que dicho marcado basado en la inclusión de elementos debe cumplir con las condiciones de buena formación. Como estos documentos tienen una estructura de árbol amplia, esto significa que solo los fragmentos balanceados de un subárbol pueden marcarse de esta manera. [11] Un medio de marcar cualquier sección arbitraria de HTML requeriría un mecanismo independiente de la estructura de marcado en sí, como XPointer .
Un buen HTML semántico también mejora la accesibilidad de los documentos web (consulte también las Pautas de accesibilidad al contenido web ). [ cita requerida ] Por ejemplo, cuando un lector de pantalla o un navegador de audio puede determinar correctamente la estructura de un documento, no perderá el tiempo del usuario con discapacidad visual leyendo información repetida o irrelevante cuando se haya marcado correctamente.
"Fragmentos enriquecidos" de Google
En 2010, Google especificó tres formas de metadatos estructurados que sus sistemas utilizarán para encontrar contenido semántico estructurado dentro de las páginas web. Google utilizará dicha información, cuando se relacione con reseñas, perfiles de personas, listas de empresas y eventos para mejorar el "fragmento" o un fragmento breve de texto citado que se muestra cuando la página aparece en las listas de búsqueda. Google especifica que esos datos se pueden proporcionar mediante microdatos , microformatos o RDFa . [12] Los microdatos se especifican en el interior itemtype
y los itemprop
atributos se agregan a los elementos HTML existentes; las palabras clave de microformato se agregan dentro de los class
atributos como se discutió anteriormente; y RDFa se basa en rel
, typeof
y property
atributos añadidos a los elementos existentes. [13]
Ver también
- RDFa
- Microformatos
- Web semántica
- Semántica (informática)
- XML
- Microdatos (HTML)
- Elementos HTML (lista completa)
Referencias
- ^ Berners-Lee, Tim ; Fischetti, Mark (2000). Weaving the Web: El diseño original y el destino final de la World Wide Web por su inventor . San Francisco: Harper. ISBN 978-0062515872.
- ^ Raggett, Dave (24 de abril de 2005). "Empezando con HTML" . Consorcio World Wide Web . Consultado el 8 de diciembre de 2010 .
- ^ Raggett, Dave (8 de abril de 2002). "Añadiendo un toque de estilo" . Consorcio World Wide Web . Consultado el 8 de diciembre de 2010 .Este artículo señala que el marcado HTML de presentación puede ser útil cuando se dirige a los navegadores "antes de Netscape 4.0 e Internet Explorer 4.0 ", ambos lanzados en 1997.
- ^ Berners-Lee, Tim; Hendler, James; Lassila, Ora (2001). "La Web Semántica" . Scientific American . Consultado el 2 de octubre de 2009 .
- ^ a b Shadbolt, Nigel; Berners-Lee, Tim; Hall, Wendy (mayo-junio de 2006). "La Web Semántica Revisada" (PDF) . Sistemas inteligentes IEEE . Consultado el 8 de diciembre de 2010 .
- ^ "HTML semántico antiguo simple (POSH)" . Wiki de microformatos . comunidad de microformatos. 20 de abril de 2007 . Consultado el 4 de mayo de 2013 .
- ^ Robinson, Mike. "Hablemos de Semántica" . Doctor HTML 5 . Consultado el 26 de octubre de 2015 .
- ^ "HTML5" . Consorcio Mundial de la red. Sección 4.5.17: El elemento i.
- ^ "HTML5" . Consorcio Mundial de la red. Sección 4.5.18: El elemento b.
- ^ Estos nombres de clase son, en el mejor de los casos, más sugerentes que formalmente significativos, a menos que hayan sido previamente compartidos entre el creador y el consumidor del contenido.
- ^ "Documentos XML bien formados" . Lenguaje de marcado extensible (XML) 1.1 . W3C .
- ^ "Fragmentos enriquecidos" . Centro para webmasters . Consultado el 26 de mayo de 2010 .
- ^ "Empresas y organizaciones - Acerca de la información de la organización" . Centro para webmasters . Consultado el 26 de mayo de 2010 .
enlaces externos
- schema.org es una iniciativa lanzada el 2 de junio de 2011 por Bing , Google y Yahoo!