JIS X 0201 , un estándar industrial japonés desarrollado en 1969 (entonces llamado JIS C 6220 hasta la reforma de la categoría JIS), fue el primer conjunto de caracteres electrónicos japoneses en ser ampliamente utilizado. Es una codificación de 7 bits o una codificación de 8 bits, aunque la codificación de 8 bits es dominante para el uso moderno. El nombre completo de este estándar es conjuntos de caracteres codificados de 7 y 8 bits para el intercambio de información ( 7 ビ ッ ト 及 び 8 ビ ッ ト の 情報 交換 用 符号 化 文字 集合).
MIME / IANA | 8 bits : JIS_X0201 7 bits romana : JIS_C6220-1969-ro 7 bits Kana : JIS_C6220-1969-jp |
---|---|
Alias | JIS C 6220 de 8 bits : csHalfWidth Katakana Roman : ISO646-JP , iso-ir-14 Kana : iso-ir-13, x0201-7 |
Idioma (s) | Japonés (soporte básico), inglés |
Estándar | JIS X 0201: 1969 |
Clasificación | ISO 646 , ISO 646 ampliado |
Precedido por | Código Wabun , JIS C 0803 |
Sucesor | Cambiar JIS |
Otras codificaciones relacionadas | Código Hangul de N bytes |
Los primeros 96 códigos comprenden una variante ISO 646 , en su mayoría siguiendo ASCII con algunas diferencias, mientras que los segundos códigos de 96 caracteres representan los signos fonéticos katakana japoneses . Dado que la codificación no proporciona ninguna forma de expresar hiragana o kanji , solo es capaz de expresar japonés escrito simplificado. Sin embargo, es posible expresar, al menos fonéticamente, la gama completa de sonidos en el idioma. En la década de 1980, esto era aceptable para medios como terminales de computadora en modo texto, telegramas, recibos u otros datos manejados electrónicamente.
JIS X 0201 fue reemplazado por codificaciones posteriores como Shift JIS (que combina este estándar y JIS X 0208 ) y Unicode posterior .
Historia
El Comite Consultatif International Telephonique et Telegraphique (CCITT) introdujo el código del Alfabeto Telegráfico Internacional No 2 (ITA2) como estándar internacional, que era la codificación latina de 5 bits. La mayoría de los países tienen sus propios estándares nacionales basados en esto. En Japón, la Agencia de Ciencia y Tecnología Industrial (AIST) lo estandarizó como los códigos de caracteres de 6 bits de JIS C 0803-1961 ( Diseño de teclado y códigos para teleimpresores ), que se combinaban con caracteres katakana. Sin embargo, no cumplía con los requisitos de la industria porque el mapa de caracteres era pequeño y el diseño del código no era práctico. El AIST consideró una codificación de caracteres práctica para reemplazar varios códigos utilizados en Japón. [1]
En 1963, ISO presentó un borrador de ISO R 646 ( juegos de caracteres codificados de 6 y 7 bits para el intercambio de procesamiento de información ). AIST comprometió la conjunción de ISO R 646 y mapeo katakana a la Sociedad de Procesamiento de Información de Japón (IPSJ). IPSJ formó el comité de estandarización del código. El comité no adoptó la forma de 6 bits del borrador de ISO porque el conjunto de katakana no encajaba en su mapa de caracteres. El primer borrador de JIS mapeó pequeños caracteres katakana junto a cada uno de sus caracteres katakana normales. Se consideró conveniente para clasificar por orden de Gojūon . Algunos miembros del comité criticaron que complicaría la mecánica de los teclados que solo manejaban caracteres katakana normales. El último borrador asignó pequeños caracteres katakana a las posiciones 0xA7-0xAF. En 1966, el cuarto borrador de ISO especificó el símbolo de la moneda nacional en 0x24, y el comité JIS planeó mapear el signo del yen . La primera edición de ISO 646 se publicó en 1967. Especificaba el signo de dólar de ASCII 0x24 como carácter invariante, por lo que el comité JIS decidió reemplazar la barra invertida 0x5c de ASCII (uno de los caracteres variantes) con el signo de yen. Sin embargo, el CCITT introdujo el Alfabeto Internacional No.5 (IA5) en 1968, que establecía que no existía ningún requisito para el signo del dólar y que podía ser reemplazado por el signo de la moneda internacional (¤). [2] ISO 646 se revisó en 1973 para cumplir con IA5. [3]
JIS C 6220 ( Códigos para el intercambio de información , 情報 交換 用 符号) se publicó en 1969. Su número se cambió a JIS X 0201 debido a la reforma de la categoría JIS en 1987, y el nombre se cambió a código de 7 y 8 bits. juegos de caracteres para el intercambio de información (7 ビ ッ ト 及 び 8 ビ ッ ト の 情報 交換 用 符号 化 文字 集合) en la edición de 1990.
El conjunto de caracteres de JIS X 0201 se había utilizado ampliamente en Japón. El Sistema Nacional de Comunicación de Datos Bancarios (全国 銀行 デ ー タ 通信 シ ス テ ム), el sistema de transferencia de fondos más grande de Japón, se estableció en 1973. Los mensajes de transacciones entre bancos usaban un subconjunto de JIS X 0201. El sistema se había usado hasta 2018, y fue reemplazado por ZEDI (Sistema de intercambio electrónico de datos bancarios a nivel nacional, 全 銀 EDI シ ス テ ム) que podía manejar caracteres hiragana y kanji. [4] En 1978, se desarrolló el conjunto de caracteres de 2 bytes JIS C 6226 ( JIS X 0208 ) para expresar los caracteres hiragana y kanji. Incluye caracteres katakana, pero sus códigos y diseño son diferentes de JIS X 0201. Los fabricantes de computadoras desarrollaron sus propias extensiones de JIS X 0208 para mantener la compatibilidad con JIS X 0201. En 1982, el esquema de codificación Microsoft Kanji (página de códigos 932 de MS-DOS ) y SJC26 de Digital Research (para CP / M-86 en japonés ) se desarrollaron para combinar la codificación de un solo byte JIS X 0201 y la codificación de doble byte JIS X 0208 sin desplazamiento ni desplazamiento de caracteres. [5] Fueron llamados Shift JIS , que se convirtió en el estándar industrial para computadoras personales.
Detalles de implementacion
La primera mitad (conjunto romano) de JIS X 0201 constituye una variante japonesa de ISO 646 , que asciende a ASCII con barra invertida (\) y tilde (~) reemplazada por yen (¥) y línea superior (‾), [6] mientras que la segunda la mitad (conjunto de Kana) consiste principalmente en katakana . Los caracteres de control se especifican en JIS X 0211 .
En el formato de 7 bits, el carácter de control de cambio de salida (0x0E) cambia al conjunto Kana y el cambio de entrada (0x0F) cambia al conjunto romano. [7] [8] En el formato de 8 bits, que se muestra en la tabla siguiente, los bytes con el bit más significativo establecido (es decir, 0x80–0xFF) se utilizan para el conjunto Kana y los bytes sin establecer (es decir, 0x00–0x7F) son utilizado de otra manera.
Los nombres utilizados específicamente para el conjunto romano de 7 bits incluyen "JISCII", [9] "JIS Roman", [10] "ISO646-JP", [11] [12] "JIS C6220-1969-ro", [12] [11] "Japanese-Roman", [13] "Japan 7-Bit Latin", [14] e "ISO-IR-14", [11] [12] [8] mientras que los nombres utilizados específicamente para el 7-bit El conjunto de Kana incluye "ISO-IR-13", [7] [11] [12] "JIS C6220-1969-jp" [11] [12] y "x0201-7". [11] [12]
La sustitución del símbolo del yen por la barra invertida puede hacer que las rutas en computadoras DOS y Windows con soporte japonés se muestren de manera extraña, como "C: ¥ Archivos de programa ¥", por ejemplo. [15] Otro problema similar son los caracteres de control de cadenas literales del lenguaje de programación C , como .printf("Hello, world.¥n");
Diseño de página de códigos
La siguiente tabla es el juego de caracteres codificados de 8 bits original de JIS X 0201 (con el juego de kana indicado por bytes con el juego de bits alto). [dieciséis]
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 | C0 códigos 0000-001F | |||||||||||||||
1_ 16 | ||||||||||||||||
2_ 32 | SP 0020 | ! 0021 | " 0022 | # 0023 | $ 0024 | % 0025 | & 0026 | « 0027 | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
3_ 48 | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
4_ 64 | @ 0040 | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | Yo 0049 | J 004A | K 004B | L 004C | M 004D | N 004E | O 004F |
5_ 80 | P 0050 | Q 0051 | R 0052 | S 0053 | T 0054 | U 0055 | V 0056 | W 0057 | X 0058 | Y 0059 | Z 005A | [ 005B | ¥ 00A5 | ] 005D | ^ 005E | _ 005F |
6_ 96 | ` 0060 | un 0061 | b 0062 | c 0063 | d 0064 | e 0065 | f 0066 | g 0067 | h 0068 | yo 0069 | j 006A | k 006B | l 006C | m 006D | n 006E | o 006F |
7_ 112 | p 0070 | q 0071 | r 0072 | s 0073 | t 0074 | u 0075 | v 0076 | w 0077 | x 0078 | y 0079 | z 007A | { 007B | | 007C | } 007D | ‾ 203E | DEL 007F |
8_ 128 | Códigos C1 o bloque vacío 0080-009F | |||||||||||||||
9_ 144 | ||||||||||||||||
A_ 160 | 。 3002 | 「 300C | 」 300D | 、 3001 | ・ 30FB | ヲ 30F2 | ァ 30A1 | ィ 30A3 | ゥ 30A5 | ェ 30A7 | ォ 30A9 | ャ 30E3 | ュ 30E5 | ョ 30E7 | ッ 30C3 | |
B_ 176 | ー 30FC | ア 30A2 | イ 30A4 | ウ 30A6 | エ 30A8 | オ 30AA | カ 30AB | キ 30AD | ク 30AF | ケ 30B1 | コ 30B3 | サ 30B5 | シ 30B7 | ス 30B9 | セ 30BB | ソ 30BD |
C_ 192 | タ 30BF | チ 30C1 | ツ 30C4 | テ 30C6 | ト 30C8 | ナ 30CA | ニ 30CB | ヌ 30CC | ネ 30CD | ノ 30CE | ハ 30CF | ヒ 30D2 | フ 30D5 | ヘ 30D8 | ホ 30DB | マ 30DE |
D_ 208 | ミ 30DF | ム 30E0 | メ 30E1 | モ 30E2 | ヤ 30E4 | ユ 30E6 | ヨ 30E8 | ラ 30E9 | リ 30EA | ル 30EB | レ 30EC | ロ 30ED | ワ 30EF | ン 30F3 | ゛ 309B | ゜ 309C |
E_ 224 | ||||||||||||||||
F_ 240 |
Letra Número Puntuación Símbolo Otro Indefinido
Como parte de Shift JIS
A continuación se muestra el mapeo utilizado para JIS X 0201 como parte de Shift JIS , [17] [18] es decir, mostrando la forma de 8 bits de JIS X 0201 y mapeando los caracteres Katakana al bloque de formularios de ancho medio y ancho completo (que a su vez deriva su diseño de kana de medio ancho de JIS X 0201).
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 | ||||||||||||||||
1_ 16 | ||||||||||||||||
2_ 32 | SP 0020 | ! 0021 | " 0022 | # 0023 | $ 0024 | % 0025 | & 0026 | « 0027 | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
3_ 48 | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
4_ 64 | @ 0040 | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | Yo 0049 | J 004A | K 004B | L 004C | M 004D | N 004E | O 004F |
5_ 80 | P 0050 | Q 0051 | R 0052 | S 0053 | T 0054 | U 0055 | V 0056 | W 0057 | X 0058 | Y 0059 | Z 005A | [ 005B | ¥ 00A5 | ] 005D | ^ 005E | _ 005F |
6_ 96 | ` 0060 | un 0061 | b 0062 | c 0063 | d 0064 | e 0065 | f 0066 | g 0067 | h 0068 | yo 0069 | j 006A | k 006B | l 006C | m 006D | n 006E | o 006F |
7_ 112 | p 0070 | q 0071 | r 0072 | s 0073 | t 0074 | u 0075 | v 0076 | w 0077 | x 0078 | y 0079 | z 007A | { 007B | | 007C | } 007D | ‾ 203E | |
8_ 128 | ||||||||||||||||
9_ 144 | ||||||||||||||||
A_ 160 | 。 FF61 | 「 FF62 | 」 FF63 | 、 FF64 | ・ FF65 | ヲ FF66 | ァ FF67 | ィ FF68 | ゥ FF69 | ェ FF6A | ォ FF6B | ャ FF6C | ュ FF6D | ョ FF6E | ッ FF6F | |
B_ 176 | ー FF70 | ア FF71 | イ FF72 | ウ FF73 | エ FF74 | オ FF75 | カ FF76 | キ FF77 | ク FF78 | ケ FF79 | コ FF7A | サ FF7B | シ FF7C | ス FF7D | セ FF7E | ソ FF7F |
C_ 192 | タ FF80 | チ FF81 | ツ FF82 | テ FF83 | ト FF84 | ナ FF85 | ニ FF86 | ヌ FF87 | ネ FF88 | ノ FF89 | ハ FF8A | ヒ FF8B | フ FF8C | ヘ FF8D | ホ FF8E | マ FF8F |
D_ 208 | ミ FF90 | ム FF91 | メ FF92 | モ FF93 | ヤ FF94 | ユ FF95 | ヨ FF96 | ラ FF97 | リ FF98 | ル FF99 | レ FF9A | ロ FF9B | ワ FF9C | ン FF9D | ゙ FF9E | ゚ FF9F |
E_ 224 | ||||||||||||||||
F_ 240 |
Los glóbulos rojos indican los primeros bytes de caracteres Shift JIS de doble byte. [5]
Mapeo alternativo de katakana
El perfil básico ISO-2022-JP no permite el conjunto Kana de JIS X 0201, solo el conjunto Roman y JIS X 0208 (aunque la propia ISO 2022 / JIS X 0202 lo permite). En consecuencia, al convertir JIS X 0201 katakana (o kana Unicode de ancho medio , que utilizan el mismo diseño) a ISO-2022-JP, a menudo se utiliza el siguiente mapeo o transformación. [20] Esto permite convertir el kana a JIS X 0208.
En teoría, este mapeo es igualmente correcto, ya que JIS X 0201 en sí mismo no especifica el ancho de visualización, aunque en la práctica (y especialmente en entornos de doble espacio ) JIS X 0201 se usa para katakana de ancho medio.
Para facilitar la comparación con el gráfico anterior, la asignación se muestra a continuación sobre la codificación katakana JIS X 0201 y con el conjunto de bits alto.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A_ | 。 3002 | 「 300C | 」 300D | 、 3001 | ・ 30FB | ヲ 30F2 | ァ 30A1 | ィ 30A3 | ゥ 30A5 | ェ 30A7 | ォ 30A9 | ャ 30E3 | ュ 30E5 | ョ 30E7 | ッ 30C3 | |
B_ | ー 30FC | ア 30A2 | イ 30A4 | ウ 30A6 | エ 30A8 | オ 30AA | カ 30AB | キ 30AD | ク 30AF | ケ 30B1 | コ 30B3 | サ 30B5 | シ 30B7 | ス 30B9 | セ 30BB | ソ 30BD |
C_ | タ 30BF | チ 30C1 | ツ 30C4 | テ 30C6 | ト 30C8 | ナ 30CA | ニ 30CB | ヌ 30CC | ネ 30CD | ノ 30CE | ハ 30CF | ヒ 30D2 | フ 30D5 | ヘ 30D8 | ホ 30DB | マ 30DE |
D_ | ミ 30DF | ム 30E0 | メ 30E1 | モ 30E2 | ヤ 30E4 | ユ 30E6 | ヨ 30E8 | ラ 30E9 | リ 30EA | ル 30EB | レ 30EC | ロ 30ED | ワ 30EF | ン 30F3 | ゛[a] 309B | ゜[b] 309C |
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F |
Variantes y ampliaciones
Cambiar JIS
Implementaciones de IBM
La página de códigos 897 esla implementación de IBM de la forma de 8 bits de JIS X 0201. Incluye varios caracteres gráficos adicionales en elárea de caracteres de control C0 , y los puntos de código en cuestión pueden usarse como caracteres de control o caracteres gráficos dependiendo de la contexto, [23] de manera similar en concepto a OEM-US , pero con diferentes caracteres gráficos. Las filas C0 se muestran a continuación.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 | NUL 0000 | ╔ 2554 | ╗ 2557 | ╚ 255A | ╝ 255D | ║ 2551 | ═ 2550 | ↓ FFEC | BS 0008 | ○ FFEE | LF 000A | 〿 303F | FF 000C | CR 000D | ■ FFED | ☼ 263C |
1_ 16 | ╬ 256C | DC1 0011 | ↕ 2195 | DC3 0013 | ▓ 2593 | ╩ 2569 | ╦ 2566 | ╣ 2563 | PUEDE 0018 | ╠ 2560 | ° / FS 2591 / 001C | ↵ 21B5 | ↑ / DEL FFEA / 007F | │ FFE8 | → FFEB | ← FFE9 |
IBM también implementa el conjunto Roman de 7 bits de JIS X 0201 como página de códigos 895 [29] y el conjunto Kana de 7 bits como página de códigos 896 para su uso como conjuntos de códigos ISO 2022 o EUC-JP . La página de códigos 896, además de las asignaciones estándar JIS X 0201, define cinco asignaciones adicionales, que se muestran a continuación. [30] Aunque el CCSID 896 asociado no permite el uso de estos caracteres extendidos , [31] sí lo permite el CCSID 4992 alternativo. [32]
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
6_ 96 | ¢ 00A2 | £ 00A3 | ¬ 00AC | \ 005C | ~ 007E |
La página de códigos 1041 de IBM es una versión extendida de la página de códigos 897, que codifica estos cinco caracteres extendidos [33] de IBM en ubicaciones alternativas que son compatibles con Shift JIS (respectivamente 0x80, 0xA0, 0xFD, 0xFE y 0xFF). [34]
La página de códigos 903 de IBM está codificada para su uso como componente de un solo byte de ciertas codificaciones de caracteres chinos simplificados . [35] A pesar de esto, sigue ISO 646-JP / la mitad romana de JIS X 0201, ya que reemplaza la barra invertida ASCII 0x5C (en lugar del signo de dólar ASCII 0x24 como en GB 1988 / ISO 646-CN ) con el yen / signo de yuan . También utiliza los mismos gráficos de sustitución de C0 que la página de códigos 897. [36] Está estrechamente relacionado conLa página de códigos 904 , que está codificada para su uso como componente de un solo byte de ciertas codificaciones de caracteres chinos tradicionales , [37] [38] y usa los mismos gráficos de reemplazo C0, pero sigue ASCII . [39]
Otros
Juego de caracteres NEC PC-8001 (1979) como se muestra en la fuente de 8 × 8 píxeles
Variante NEC utilizada en la serie PC98 .
Variante de Hitachi utilizada en el HD44780 .
Notas al pie
- ^ Se asigna para corresponder al carácter JIS X 0208 (asignado a U + 309B), no a la normalización de compatibilidad (que sería U + 3099, la versión combinada). [22]
- ^ Se asigna para corresponder al carácter JIS X 0208 (asignado a U + 309C), no a la normalización de compatibilidad (que sería U + 309A, la versión combinada). [22]
Referencias
- ^ 行政管理 庁 (Agencia de Gestión Administrativa) (1968).行政 に お け る 電子 計算機 の 共同 利用 関 す る 調査 研究 報告 書(en japonés). 行政事務 機械化 研究 協会. págs. 108-113. OCLC 703804474 .
- ^ CCITT (1969). "Recomendación V.3: Alfabeto internacional núm. 5". Libro Blanco: Tomo VIII - CCITT (Mar del Plata, 1968) . Unión Internacional de Telecomunicaciones . págs. 11-19 . Consultado el 25 de julio de 2019 .
- ^ Yasuoka, Koichi; Yasuoka, Motoko (2006). "2.2 ASCII と ISO R 646 と JIS C 6220".文字 符号 の 歴 史(en japonés). 共 立 出版. págs. 89–112. ISBN 4-320-12102-3.
- ^ "経 理 部門 の 人材 不足 で 悩 む 会 社 に 朗 報 、 金融 EDI「 ZEDI 」が 2018 年 稼 働 へ" . Nikkei X-TECH . 2017-11-30 . Consultado el 24 de julio de 2019 .
- ^ a b 西 田, 憲 正 (19 de diciembre de 1983). "Unix 風 の 機能 を 持 ち 込 ん だ 日本語 MS-DOS 2.0 の 機能 と 内部 構造".日 経 エ レ ク ト ロ ニ ク ス(en japonés). Nikkei McGraw-Hill : 165-190. ISSN 0385-1680 .
- ^ "3.1.1 Detalles de problemas" . Problemas y soluciones para Unicode y caracteres definidos por el usuario / proveedor . El Grupo Abierto de Japón. Archivado desde el original el 3 de febrero de 1999 . Consultado el 15 de abril de 2019 .
- ^ a b ISO-IR 013: El conjunto de caracteres gráficos japoneses KATAKANA (PDF) , Comisión de Normas de Tecnología de la Información de Japón (ITSCJ / IPSJ)
- ^ a b ISO-IR 014: El conjunto de caracteres gráficos romanos japoneses (PDF) , Comisión de Normas de Tecnología de la Información de Japón (ITSCJ / IPSJ)
- ^ "IBM-943 e IBM-932" , IBM Knowledge Center , IBM
- ^ "kUnicodeForceASCIIRangeMask" , Documentación para desarrolladores de Apple , Apple Inc
- ^ a b c d e f RFC 1345
- ^ a b c d e f "Juegos de caracteres" . IANA.
- ^ da Cruz, Frank (2010-04-02), "Nombres de conjuntos de caracteres de Kermit y MIME" , Proyecto Kermit , Universidad de Columbia
- ^ "CP 00895" , IBM Globalization - Identificadores de página de códigos , IBM
- ^ Kaplan, Michael S. (17 de septiembre de 2005). "¿Cuándo una barra invertida no es una barra invertida?" .
- ^ JIS X 0201-1997 (en japonés). Asociación Japonesa de Normas . 1997-02-28. pag. 17.
- ^ "ibm-943_P130-1999" . Demostración de UCI - Explorador de convertidores . Componentes internacionales para Unicode .
- ^ Apple, Inc (5 de abril de 2005) [15 de abril de 1995]. "JAPANESE.TXT: Mapa (versión externa) de la codificación japonesa de Mac OS a Unicode 2.1 y posterior" . Consorcio Unicode .
- ^ van Kesteren, Anne (11 de febrero de 2019). "12.2.2. Codificador ISO-2022-JP" . Estándar de codificación . WHATWG .
- ^ Elestándar de codificación WHATWG , por ejemplo, lo usa como una transformación al codificar datos kana de ancho medio Unicode a ISO-2022-JP. [19]
- ^ van Kesteren, Anne (6 de enero de 2018). "Índice ISO-2022-JP Katakana" . Estándar de codificación . WHATWG .
- ^ a b van Kesteren, Anne (11 de febrero de 2019). "5. Índices" . Estándar de codificación . WHATWG .
- ^ "Identificadores de página de códigos - CP 00897" . Globalización de IBM . IBM. Archivado desde el original el 17 de marzo de 2016.
- ^ "CP00897.pdf" (PDF) . IBM. Archivado (PDF) desde el original el 12 de enero de 2019 . Consultado el 5 de diciembre de 2017 .
- ^ "CP00897.txt" . IBM. Archivado desde el original el 12 de enero de 2019 . Consultado el 5 de diciembre de 2017 .
- ^ "Explorador de convertidores - ibm-943_P130-1999" . Demostración en UCI . Componentes internacionales para Unicode.
- ^ "Identificadores de juego de caracteres codificados - CCSID 943" . Globalización de IBM . IBM. Archivado desde el original el 15 de marzo de 2016.
- ^ Los gráficos se enumeran según CP00897.pdf y CP00897.txt proporcionados por IBM. [24] [25] Los controles se enumeran, en ausencia de función gráfica o cuando difieren de ASCII, según el códec ibm-943_P130-1999 proporcionado por IBM a International Components para Unicode [26] (IBM-943 es una página de códigos 897 superconjunto). [27] SUB se asigna a 0x7F.
- ^ "CP00895.pdf" (PDF) . IBM. Archivado (PDF) desde el original el 8 de diciembre de 2017 . Consultado el 6 de diciembre de 2017 .
- ^ a b "CP00896.pdf" (PDF) . IBM. Archivado (PDF) desde el original el 12 de enero de 2019 . Consultado el 5 de diciembre de 2017 .
- ^ "Identificadores de juego de caracteres codificados - CCSID 896" . Globalización de IBM . IBM. Archivado desde el original el 26 de marzo de 2016.
- ^ "Identificadores de juego de caracteres codificados - CCSID 4992" . Globalización de IBM . IBM. Archivado desde el original el 27 de marzo de 2016.
- ^ "11.2 - Conjunto IBM Extended SBCS". Conjunto de caracteres gráficos japoneses de IBM para código UNIX extendido (EUC) (PDF) . IBM. pag. 315. Archivado (PDF) desde el original el 12 de enero de 2019 . Consultado el 7 de diciembre de 2017 .
- ^ "CP01041.pdf" (PDF) . IBM. Archivado (PDF) desde el original el 12 de enero de 2019 . Consultado el 5 de diciembre de 2017 .
- ^ "Identificadores de página de códigos - CP 903" . Globalización de IBM . IBM. Archivado desde el original el 17 de marzo de 2016.
- ^ "CP00903.pdf" (PDF) . IBM. Archivado (PDF) desde el original el 12 de enero de 2019 . Consultado el 17 de febrero de 2018 .
- ^ "Identificadores de página de códigos - CP 904" . Globalización de IBM . IBM.[ enlace muerto permanente ]
- ^ "Identificadores de juego de caracteres codificados - CCSID 904" . Globalización de IBM . IBM. Archivado desde el original el 27 de marzo de 2016.
- ^ "CP00904.pdf" (PDF) . IBM. Archivado (PDF) desde el original el 12 de enero de 2019 . Consultado el 11 de mayo de 2018 .
enlaces externos
- Diagrama de JIS X 0201 (como conjuntos de códigos de 7 bits)