Iniciativa de codificación de texto


La Iniciativa de codificación de texto ( TEI ) es una comunidad de práctica centrada en el texto en el campo académico de las humanidades digitales , que opera continuamente desde la década de 1980. Actualmente, la comunidad ejecuta una lista de correo, reuniones y series de conferencias, y mantiene el estándar técnico de TEI , un diario , un wiki , un repositorio de GitHub y una cadena de herramientas .

Las Directrices TEI definen colectivamente un tipo de formato XML y son el resultado definitorio de la comunidad de práctica. El formato difiere de otros formatos abiertos conocidos para texto (como HTML y OpenDocument ) en que es principalmente semántico en lugar de presentacional; se especifica la semántica y la interpretación de cada etiqueta y atributo. Hay unos 500 componentes y conceptos textuales diferentes ( palabra , [1] oración , [2] carácter , [3] glifo , [4] persona , [5]etc.); cada uno se basa en una o más disciplinas académicas y se dan ejemplos.

El estándar se divide en dos partes, una descripción textual discursiva con ejemplos extensos y discusión y un conjunto de definiciones etiqueta por etiqueta. Los esquemas en la mayoría de los formatos modernos ( DTD , RELAX NG y W3C Schema ) se generan automáticamente a partir de las definiciones etiqueta por etiqueta. Una serie de herramientas apoyan la producción de las directrices y la aplicación de las directrices a proyectos específicos.

Se utilizan varias etiquetas especiales para eludir las restricciones impuestas por el Unicode subyacente ; glifo para permitir la representación de caracteres que no califican para la inclusión de Unicode [1] y opción para permitir superar la linealidad estricta requerida. [6]

La mayoría de los usuarios del formato no utilizan la gama completa de etiquetas, sino que producen una personalización utilizando un subconjunto específico del proyecto de las etiquetas y atributos definidos por las Directrices. El TEI define un sofisticado mecanismo de personalización conocido como ODD para este propósito. Además de documentar y describir cada etiqueta TEI, una especificación ODD especifica su modelo de contenido y otras restricciones de uso, que pueden expresarse mediante schematron .

TEI Lite es un ejemplo de tal personalización. Define un formato de archivo basado en XML para intercambiar textos. Es una selección manejable del extenso conjunto de elementos disponibles en las Directrices TEI completas.


Iniciativa de codificación de textoTEI Logo.svg