Formularios de ancho medio y ancho completo


En la informática CJK (chino, japonés y coreano), los caracteres gráficos se clasifican tradicionalmente en ancho completo (en Taiwán y Hong Kong :全形; en CJK:全角) y medio ancho (en Taiwán y Hong Kong :半形; en CJK:半角) caracteres. A diferencia de las fuentes monoespaciadas , un carácter de ancho medio ocupa la mitad del ancho de un carácter de ancho completo, de ahí el nombre.

Formularios de ancho medio y ancho completo también es el nombre de un bloque Unicode U+FF00–FFEF, proporcionado para que las codificaciones más antiguas que contienen caracteres de ancho medio y ancho completo puedan tener una traducción sin pérdidas hacia/desde Unicode.

En los días de la informática en modo texto , los caracteres occidentales normalmente se presentaban en una cuadrícula en la pantalla, a menudo de 80 columnas por 24 o 25 líneas. Cada carácter se mostraba como una pequeña matriz de puntos , a menudo de unos 8 píxeles de ancho, y generalmente se usaba un SBCS (conjunto de caracteres de un solo byte) para codificar caracteres de idiomas occidentales.

Por razones estéticas y de legibilidad, es preferible que los caracteres Han tengan una forma aproximadamente cuadrada, por lo tanto, el doble de ancho que estos caracteres SBCS de ancho fijo. Como estos estaban típicamente codificados en un DBCS (juego de caracteres de doble byte), esto también significaba que su ancho en la pantalla en una fuente a dos espacios era proporcional a su longitud en bytes. Algunas terminales y programas de edición no podían manejar caracteres de doble byte que comenzaran en columnas impares, solo pares (algunos ni siquiera podían poner caracteres de doble byte y de un solo byte en la misma línea). Por lo tanto, los conjuntos DBCS generalmente incluían caracteres romanos y dígitos también, para usar junto con los caracteres CJK en la misma línea.

Por otro lado, la computación japonesa temprana usaba una página de códigos de un solo byte llamada JIS X 0201 para katakana . Estos se representarían con el mismo ancho que los otros caracteres de un solo byte, lo que los convierte en caracteres kana de ancho medio en lugar de kana de proporciones normales. Aunque el estándar JIS X 0201 en sí mismo no especificaba la pantalla de ancho medio para katakana, esta se convirtió en la característica distintiva visual en Shift JIS entre el JIS X 0201 de un solo byte y el JIS X 0208 de doble byte katakana. Algunas páginas de códigos de IBM utilizaron un tratamiento similar para el jamo coreano , [1] basado en el código Hangul de N bytes y su traducción EBCDIC .

Para la compatibilidad con los conjuntos de caracteres existentes que contenían versiones de ancho medio y ancho completo del mismo carácter, Unicode asignó un solo bloque en U + FF00–FFEF que contenía los caracteres de "ancho alternativo" necesarios. Esto incluye una versión de ancho completo de todos los caracteres ASCII y algunos signos de puntuación que no son ASCII, como el signo Yen, versiones de ancho medio de katakana y hangul , y versiones de ancho medio de algunos otros símbolos, como círculos. Solo se asignaron los caracteres necesarios para el viaje de ida y vuelta sin pérdidas a los conjuntos de caracteres existentes, en lugar de (por ejemplo) hacer una versión de ancho completo de cada carácter con acento latino.


Un símbolo del sistema ( cmd.exe ) con localización coreana, que muestra caracteres de ancho medio y ancho completo
Los caracteres que aparecen tanto en JIS X 0201 (un solo byte) como en JIS X 0208 / JIS X 0213 (doble byte) tienen formato de ancho medio y ancho completo en Shift JIS .