Idiomas de descripción de caracteres chinos

Los idiomas de descripción de caracteres chinos son varios idiomas propuestos para describir de manera más precisa y completa los caracteres e información chinos (o CJK ), como su lista de componentes, lista de trazos (básicos y complejos), su orden y la ubicación de cada uno de ellos en un cuadrado vacío de fondo. Están diseñados para superar la falta inherente de información dentro de una descripción de mapa de bits. Esta información enriquecida se puede utilizar para identificar variantes de caracteres que están unificados en un punto de código por Unicode e ISO / IEC 10646 , así como para proporcionar una forma alternativa de representación para caracteres raros que aún no tienen una codificación estandarizada en Unicode o ISO / IEC 10646. Muchos tienen como objetivo trabajar para el estilo Kaishuy el estilo de la canción , así como para proporcionar la estructura interna del personaje que se puede utilizar para facilitar la búsqueda de un personaje indexando la composición interna del personaje y haciendo referencias cruzadas entre personajes similares.

Character Description Language es una tecnología de fuentes , basada en XML , co-creada por Tom Bishop y Richard Cook para Wenlin Institute, Inc , diseñada para describir cualquier carácter CJK , pero adecuada para describir cualquier glifo .

Este lenguaje declarativo basado en XML define el orden de trazos de cada componente (una subunidad del glifo similar a un radical , pero que no necesariamente tiene el significado semántico de un verdadero radical), así como el ensamblaje de componentes previamente definidos para construir cada vez más. personajes complejos. Muchos de estos componentes son personajes por derecho propio, además de servir como componentes básicos.

En consecuencia, un conjunto de menos de 50 trazos ^[1] permite construir un conjunto de aproximadamente 1000 componentes ^[2] que a su vez pueden estar incrustados dentro de decenas de miles de descripciones de caracteres. ^[2] Un cambio en la forma de uno de los 50 trazos básicos se aplica implícitamente dentro de cada carácter que incrusta ese trazo. Asimismo, un cambio en un componente se aplica implícitamente dentro de todos y cada uno de los personajes cuyo ensamblaje usa ese componente. ^[2]

El recuento de trazos de un carácter generalmente está relacionado con el recuento de trazos de otros caracteres. La mayoría de los personajes se construyen a partir de componentes, y siempre que se definan los recuentos de trazos de esos componentes, rara vez hay dificultades para sumarlos para obtener el recuento de trazos combinados. Por lo tanto, si un estándar define los trazos de algunos miles de caracteres, define implícitamente los trazos de muchos miles de caracteres adicionales. ^[3]

Un lenguaje de descripción de caracteres destinado a proporcionar caracteres raros que faltan en los documentos (abordando el equivalente chino del problema gaiji ). ^{[5] Los} documentos pueden contener marcas para los caracteres que faltan, lo que activará automáticamente la generación de fuentes pequeñas para proporcionar los caracteres. El lenguaje en sí es una notación simple de sufijo que describe trazos y formas de combinarlos. El software prototipo usa Metapost para renderizar los personajes e incrustarlos en documentos LaTeX . El lenguaje fue presentado por Wai Wong en 1997, ^[6] y los artículos sobre su implementación en Metapost y LaTeX aparecieron en conferencias de grupos de usuarios de TeX en 2003. ^[7]^[8]

Enfoque de CDL de componentes en cascada.