lenguaje de marcas


El marcado se refiere a los datos incluidos en un documento electrónico que es distinto del contenido del documento en el sentido de que normalmente no se incluye en las representaciones del documento para los usuarios finales, por ejemplo, en papel o en una pantalla de computadora, o en una transmisión de audio. [1] El marcado se usa a menudo para controlar la visualización del documento o para enriquecer su contenido para facilitar el procesamiento automatizado. Un lenguaje de marcado es un conjunto de reglas que rigen qué información de marcado se puede incluir en un documento y cómo se combina con el contenido del documento de manera que facilite el uso por parte de humanos y programas informáticos. La idea y la terminología evolucionaron a partir del "marcado" de los manuscritos en papel.(es decir, las instrucciones de revisión por parte de los editores), que tradicionalmente se escribe con bolígrafo rojo o lápiz azul en los manuscritos de los autores. [2]

Los lenguajes de marcado más antiguos, que generalmente se enfocan en la tipografía y la presentación, incluyen troff , TeX y LaTeX . Scribe y la mayoría de los lenguajes de marcado modernos, por ejemplo XML , identifican los componentes del documento (por ejemplo, encabezados, párrafos y tablas), con la expectativa de que se utilice tecnología como hojas de estilo para aplicar formato u otro procesamiento.

Algunos lenguajes de marcado, como el HTML ampliamente utilizado, tienen una semántica de presentación predefinida , lo que significa que su especificación prescribe algunos aspectos de cómo presentar los datos estructurados en medios particulares. HTML, como DocBook , Open eBook , JATS y muchos otros, se basa en los metalenguajes de marcado SGML y XML . Es decir, SGML y XML permiten a los diseñadores especificar esquemas particulares , que determinan qué elementos, atributos y otras características están permitidos y dónde.

Una característica extremadamente importante de la mayoría de los lenguajes de marcado es que permiten mezclar el marcado con el contenido del documento, como texto e imágenes. Por ejemplo, si es necesario enfatizar pocas palabras en una oración , o identificarlas como un nombre propio, un término definido u otro elemento especial, el marcado puede insertarse entre los caracteres de la oración. Esto es bastante diferente estructuralmente de las bases de datos tradicionales , donde por definición es imposible tener datos que estén dentro de un registro pero no dentro de ningún campo. Además, el marcado de textos legibles por humanos debe mantener el orden: no sería suficiente convertir cada párrafo de un libro en un registro de "párrafo", donde esos registros no mantienen el orden.

El marcado sustantivo se deriva de la práctica editorial tradicional llamada "marcar" un manuscrito , [3] que consiste en agregar anotaciones manuscritas en forma de instrucciones de imprenta simbólicas convencionales , en los márgenes y el texto de un artículo o un manuscrito impreso. .

Durante siglos, esta tarea la realizaban principalmente tipógrafos expertos conocidos como "marcadores" [4] o "marcadores d" [5] que marcaban el texto para indicar qué tipo de letra , estilo y tamaño se debía aplicar a cada parte, y luego pasó el manuscrito a otros para que lo escribieran a mano oa máquina.


Ejemplo de RecipeBook, un lenguaje de marcado simple basado en XML para la creación de recetas. El marcado se puede convertir mediante programación para su visualización en, por ejemplo, HTML , PDF o formato de texto enriquecido .