lenguaje de marcado


En el procesamiento de texto por computadora, un lenguaje de marcado son metadatos para anotar un documento (es decir, una página web), que se distinguen visualmente de cómo el usuario normalmente ve el documento. [1] Se usa solo para dar formato al texto, por lo tanto, cuando el documento se representa para su visualización, el lenguaje de marcado no aparece. [2] La idea y la terminología evolucionaron a partir de las "marcas" de los manuscritos en papel (es decir, las instrucciones de revisión de los editores), que tradicionalmente se escriben con bolígrafo rojo o lápiz azul en los manuscritos de los autores. [3]Dicho "marcado" generalmente incluye tanto correcciones de contenido (como ortografía, puntuación o movimiento de contenido) como instrucciones tipográficas , como hacer un encabezado más grande o en negrita.

En los medios digitales , este "texto de instrucción de lápiz azul" fue reemplazado por etiquetas que idealmente indican cuáles son las partes del documento , en lugar de detalles de cómo podrían mostrarse en alguna pantalla. Esto permite a los autores evitar formatear todas las instancias del mismo tipo de forma redundante (y posiblemente inconsistente). También evita la especificación de fuentes y dimensiones que pueden no aplicarse a muchos usuarios (como aquellos con pantallas de diferentes tamaños, problemas de visión y software de lectura de pantalla).

Los primeros sistemas de marcado generalmente incluían instrucciones de composición tipográfica, como lo hacen troff , TeX y LaTeX , mientras que Scribe y la mayoría de los sistemas de marcado modernos nombran componentes y luego procesan esos nombres para aplicar formato u otro procesamiento, como en el caso de XML .

Algunos lenguajes de marcado, como el HTML ampliamente utilizado , tienen una semántica de presentación predefinida, lo que significa que su especificación prescribe algunos aspectos de cómo presentar los datos estructurados en medios particulares. HTML, como DocBook , Open eBook , JATS y muchos otros, es una aplicación específica de los metalenguajes de marcado SGML y XML . Es decir, SGML y XML permiten a los usuarios especificar esquemas particulares , que determinan exactamente qué elementos, atributos y otras características están permitidos y dónde.

Una característica extremadamente importante de la mayoría de los lenguajes de marcas es que permiten mezclar marcas directamente en flujos de texto. Esto sucede todo el tiempo en los documentos: algunas palabras en una oración deben enfatizarse o identificarse como un nombre propio, término definido u otro elemento especial. Esto es bastante diferente estructuralmente de las bases de datos tradicionales , en las que, por definición, es imposible tener datos que estén (por ejemplo) dentro de un registro, pero no dentro de ningún campo. Asimismo, el marcado de textos en lenguaje natural debe mantener el orden: no sería suficiente convertir cada párrafo de un libro en un registro de "párrafo", donde esos registros no mantienen el orden.

El marcado de sustantivo se deriva de la práctica editorial tradicional llamada "marcar" un manuscrito , [4] que consiste en agregar anotaciones manuscritas en forma de instrucciones de imprenta simbólicas convencionales , en los márgenes y el texto de un artículo o un manuscrito impreso. .


Ejemplo de RecipeBook, un lenguaje sencillo basado en XML para la creación de recetas. El marcado se puede convertir a HTML , PDF y formato de texto enriquecido utilizando un lenguaje de programación o XSLT .