ISO / IEC 10367 : 1991 es un estándar desarrollado por ISO / IEC JTC 1 / SC 2 , [1] que define conjuntos de caracteres gráficos para su uso en codificaciones de caracteres que implementan los niveles 2 y 3 de ISO / IEC 4873 [2] (a diferencia de ISO / IEC 8859 , que define codificaciones de caracteres en el nivel 1 de ISO / IEC 4873).
Relación con ISO / IEC 8859
Las partes de ISO / IEC 8859 definen codificaciones completas en el nivel 1 de ISO / IEC 4873 (es decir, como codificaciones ASCII extendidas sin estado de un solo byte , reservando el área C1 ) y no permiten el uso de varias partes juntas. Para su uso en los niveles 2 y 3 de ISO / IEC 4873 (es decir, con códigos de desplazamiento para conjuntos de caracteres gráficos adicionales), ISO / IEC 8859 estipula que deben usarse conjuntos equivalentes de ISO / IEC 10367 en su lugar. [3]
ISO / IEC 10367: 1991 incluye ASCII , así como conjuntos que coinciden con los conjuntos G1 utilizados para los lados derechos (partes no ASCII) de ISO / IEC 6937 ( ITU T.51 ) y de ISO / IEC 8859 partes 1 a 9 (es decir, las partes que existían en 1991, cuando se publicó), un conjunto de caracteres romanos adicionales que complementan algunas de esas partes y un conjunto de caracteres de dibujo de caja (que se muestran a continuación). [2] [4]
Conjunto complementario G3 Latin
ISO / IEC 10367 incluye el conjunto gráfico ISO-IR-154 , que está destinado a complementar los alfabetos latinos número 1, 2 y 5 (es decir, ISO-8859-1 , ISO-8859-2 e ISO-8859-9 ). [4] Específicamente, está diseñado para usarse como un conjunto G3 en un perfil de ISO / IEC 4873 en el que los conjuntos G1 y G2 incluyen el lado derecho de ISO-8859-2, y también el de ISO-8859- 1 o ISO-8859-9. [5] Estas configuraciones representan todo el repertorio ISO / IEC 6937 (ITU T.51 Anexo A) sin códigos sin espaciado. [6]
Por ejemplo, la letra Ĉ estaría codificada bajo ISO / IEC 4873 nivel 2 como 0x8F 0x23
si este conjunto estuviera incluido.
Los caracteres que también aparecen en ISO-8859-1 se muestran a continuación con un cuadro gris, mientras que los que también aparecen en ISO-8859-9 se muestran con un cuadro verde. Según la edición actual de ISO / IEC 4873 / ECMA-43 (aunque no en ediciones anteriores), [7] caracteres deben usarse del conjunto de trabajo con el número más bajo en el que aparecen, por lo tanto, esos caracteres no se usan de este conjunto G3 cuando el el conjunto del lado derecho ISO-8859 respectivo se utiliza como conjunto G1 o G2. [8]
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2_ / A_ | Ā 0100 | Ĉ 0108 | Ċ 010A | Ė 0116 | Ē 0112 | Ĝ 011C | ' 2018 | “ 201C | ™ 2122 | ← 2190 | ↑ 2191 | → 2192 | ↓ 2193 | |||
3_ / B_ | ā 0101 | ĉ 0109 | ċ 010B | ð 00F0 | ė 0117 | ē 0113 | ĝ 011D | ' 2019 | " 201D | ♪ 266A | ⅛ 215B | ⅜ 215C | ⅝ 215D | ⅞ 215E | ||
4_ / C_ | Ğ 011E | Ġ 0120 | Ģ 0122 | Ĥ 0124 | Ħ 0126 | Ĩ 0128 | © 0130 | Ī 012A | Į 012E | IJ 0132 | Ĵ 0134 | Ķ 0136 | Ļ 013B | Ŀ 013F | Ņ 0145 | |
5_ / D_ | - 2014 | Ŋ 014A | Ō 014C | Œ 0152 | Ŗ 0156 | Ŝ 015C | Ŧ 0166 | Þ 00DE | × 0168 | Ŭ 016C | Ū 016A | Ų 0172 | w 0174 | Ý 00DD | Ŷ 0176 | Ÿ 0178 |
6_ / E_ | Ω 2126 | ğ 011F | ġ 0121 | ģ 0123 | ĥ 0125 | ħ 0127 | ĩ 0129 | ı 0131 | ī 012B | į 012F | ij 0133 | ĵ 0135 | ķ 0137 | ¸ 013C | ŀ 0140 | ņ 0146 |
7_ / F_ | ĸ 0138 | ŋ 014B | ō 014D | œ 0153 | ŗ 0157 | ŝ 015D | ŧ 0167 | þ 00FE | ũ 0169 | ŭ 016D | ū 016B | ų 0173 | ŵ 0175 | ý 00FD | ŷ 0177 | ʼn 0149 |
Conjunto de dibujo de caja
A continuación se muestra el conjunto de dibujos de caja de ISO / IEC 10367, que está registrado para el uso de ISO / IEC 2022 como ISO-IR-155 . No utiliza las posiciones 0x 20 / A0 o 0x7F / FF, pero está registrado como un conjunto de 96 caracteres. [9]
Perl libintl incluye un códec "ISO_10367-BOX". Esto codifica / decodifica ASCII sobre GL y el dibujo de caja ISO-IR-155 configurado sobre GR con algunas desviaciones. Específicamente, incluye caracteres de dibujo de caja de doble línea en lugar de caracteres de línea gruesa, y reemplaza el medio bloque superior (▀) en 0xCB con un carácter de uso privado U + E019, documentado como "Espacio de unidad B". [10]
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2_ / A_ | ||||||||||||||||
3_ / B_ | ||||||||||||||||
4_ / C_ | ┃ 2503 | ━ 2501 | ┏ 250F | ┓ 2513 | ┗ 2517 | ┛ 251B | ┣ 2523 | ┫ 252B | ┳ 2533 | ┻ 253B | ╋ 254B | ▀ 2580 | ▄ 2584 | █ 2588 | ▪ 25AA | |
5_ / D_ | │ 2502 | ─ 2500 | ┌ 250C | ┐ 2510 | └ 2514 | ┘ 2518 | ├ 251C | ┤ 2524 | ┬ 252C | ┴ 2534 | ┼ 253C | ° 2591 | ▒ 2592 | ▓ 2593 | ||
6_ / E_ | ||||||||||||||||
7_ / F_ |
Referencias
- ^ ISO / IEC JTC 1 / SC 2 (1991). "Tecnología de la información - Juegos de caracteres gráficos codificados estandarizados para su uso en códigos de 8 bits" . ISO . ISO / IEC 10367: 1991.
- ^ a b van Wingen, Johan W (1999). "8. Extensión de código, ISO 2022 y 2375, ISO 4873 y 10367" . Juegos de caracteres. Letras, tokens y códigos . Terena.
- ^ ISO / IEC JTC 1 / SC 2 ( 12 de febrero de 1998). Texto final de DIS 8859-10, Tecnología de la información - Conjuntos de caracteres gráficos codificados de un solo byte de 8 bits - Parte 10: Alfabeto latino No. 6 (PDF) . ISO / IEC FDIS 8859-10: 1998, JTC1 / SC2 N2992, WG3 N415.
- ^ a b "Juegos de caracteres de 8 bits - ISO / IEC 10367" . Guía para el uso de juegos de caracteres en Europa . DKUUG .
- ^ a b ECMA (1 de marzo de 1990). "Conjunto complementario para los alfabetos latinos 1, 2 y 5" (PDF) . ITSCJ / IPSJ . ISO-IR-155.
- ^ ISO / IEC JTC 1 / SC 2 / WG 3 (15 de abril de 1998). "Anexo E: Representación alternativa codificada del repertorio sin signos diacríticos no espaciados". WD 6937, Juego de caracteres gráficos codificados para comunicación de texto - Alfabeto latino (PDF) . pag. 37. JTC1 / SC2 / N454.
- ^ ECMA (1991). "Principales diferencias entre la segunda edición (1985) y la actual (tercera) edición de esta Norma ECMA". ECMA-43: Estructura y reglas del juego de caracteres codificados de 8 bits (PDF) (Estándar ECMA) (3ª ed.). pag. 23.
- ^ ECMA (1991). "Codificación única de caracteres". ECMA-43: Estructura y reglas del juego de caracteres codificados de 8 bits (PDF) (Estándar ECMA) (3ª ed.). pag. 10.
- ^ a b ISO / IEC / JTC1 / SC2 / WG3 (16 de abril de 1990). "Conjunto básico de dibujos de cajas" (PDF) . ITSCJ / IPSJ . ISO-IR-155.
- ^ Flohr, Guido. "Rutinas de conversión para ISO_10367_BOX" . libintl-perl . Locale :: RecodeData :: ISO_10367_BOX.