GB / T 2312-1980 es un conjunto de caracteres oficiales clavede la República Popular de China , que se utiliza para los caracteres chinos simplificados . GB2312 es el nombre de Internet registrado para EUC-CN , que es su forma codificada habitual. GB se refiere a los estándares Guobiao (国家 标准), mientras que elsufijo T (推荐; tuījiàn ; 'recomendación') denota un estándar no obligatorio. [1]
MIME / IANA | GB_2312-80 ( GB2312 para el formulario EUC habitual) |
---|---|
Alias | iso-ir-58, chino, csISO58GB231280 |
Idioma (s) | Chino simplificado , inglés Soporte parcial: ruso , griego , japonés |
Estándar | GB / T 2312-1980 |
Clasificación | Codificación DBCS , CJK compatible con ISO-2022 |
Extensiones | ISO-IR-165 |
Formatos de codificación | EUC-CN ( GB2312 ), HZ-GB-2312 |
Precedido por | Código telegráfico chino |
Sucesor | GBK , GB 18030 |
Otras codificaciones relacionadas | JIS X 0208 , KS X 1001 |
GB / T 2312-1980 fue originalmente un estándar nacional obligatorio designado GB 2312-1980 . Sin embargo, siguiendo un Boletín de Normas Nacionales de la República Popular de China en 2017, GB 2312 ya no es obligatorio y su código estándar se modifica a GB / T 2312-1980 . [2] GB / T 2312-1980 ha sido reemplazado por GBK y GB18030 , que incluyen caracteres adicionales, pero GB / T 2312 sigue siendo de uso generalizado como un subconjunto de esas codificaciones.
En marzo de 2021 [actualizar], GB2312 es la codificación específica para chino declarada más popular en la web, con un 9,9% de las páginas web servidas desde China y territorios que lo declaran, [3] o el 0,2% de todas las páginas web a nivel mundial, una caída del 3,5%. en enero de 2010. [4] Sin embargo, tenga en cuenta que todos los principales navegadores web decodifican los documentos marcados como, por ejemplo, "GB2312" o " GB 2312 " (aunque no todos para "GB_2312") como si estuvieran marcados como " gbk ", [5] que es una codificación de superconjunto, y GB 2312 y GBK tienen una participación combinada del 10,6% (o el 0,3% a nivel mundial).
Existe un conjunto de caracteres análogo conocido como GB / T 12345 , estrechamente relacionado con GB / T 2312, pero con formas de caracteres tradicionales que reemplazan las formas simplificadas y algunos 62 caracteres suplementarios adicionales. [6] [7] Las fuentes codificadas en GB a menudo vienen en pares, una con el juego de caracteres GB / T 2312 (simplificado) y la otra con el juego de caracteres GB / T 12345 (tradicional).
Caracteres
Si bien GB / T 2312 cubre más del 99,99% del uso de texto chino contemporáneo, [8] los textos históricos y muchos nombres quedan fuera de alcance. El antiguo estándar GB 2312 incluye 6.763 caracteres chinos (en dos niveles: el primero está ordenado por lectura, el segundo por radical y luego por el número de trazos), junto con símbolos y puntuación, kana japonés , los alfabetos griego y cirílico , Zhuyin y un doble -byte conjunto de letras Pinyin con marcas de tono. En la versión posterior GB / T 2312-1980, hay 7445 letras.
Los caracteres en GB / T 2312 están dispuestos en una cuadrícula de 94x94 (como en ISO 2022 ), y el punto de código de dos bytes de cada carácter se expresa en forma kuten (o quwei), que especifica una fila (ku o qu) y la posición del carácter dentro de la fila (celda, diez o wei).
Las filas (numeradas del 1 al 94) contienen los siguientes caracteres:
- 01-09, que incluye puntuación y otros caracteres especiales; también Hiragana , Katakana , Griego , Cirílico , Pinyin , Bopomofo
- 16–55, el primer nivel de caracteres chinos , organizado según Pinyin . (3755 caracteres).
- 56–87, el segundo nivel de caracteres chinos, ordenados según radicales y trazos. (3008 caracteres).
- 88–89, más caracteres chinos. (103 caracteres). Definido solo para GB / T 12345, no GB / T 2312.
Las filas 10-15 y 90-94 no están asignadas.
Para GB / T 2312-1980, contiene 682 signos y 6763 caracteres chinos.
Codificaciones de GB / T 2312
EUC-CN
EUC-CN se utiliza a menudo como codificación de caracteres (es decir, para almacenamiento externo) en programas que tratan con GB / T 2312, manteniendo así la compatibilidad con ASCII . Se utilizan dos bytes para representar todos los caracteres que no se encuentran en ASCII . El valor del primer byte es de 0xA1–0xF7 (161–247), mientras que el valor del segundo byte es de 0xA1–0xFE (161–254). Dado que todos estos rangos están más allá de ASCII, como UTF-8, es posible verificar si un byte es parte de una construcción multibyte cuando se usa EUC-CN, pero no si un byte es el primero o el último.
Comparado con UTF-8 , GB2312 (ya sea nativo o codificado en EUC-CN) es más eficiente en almacenamiento: mientras que UTF-8 usa tres bytes [a] por ideograma CJK , GB2312 solo usa dos. Sin embargo, GB2312 no cubre tantos ideogramas como Unicode.
Para mapear los puntos de código kuten a bytes, agregue 160 (0xA0) al número de fila (ku, el lugar de los 1000 y 100) del punto de código para formar el byte alto, y agregue 160 al número de columna (diez, los decenas y 1s) del punto de código para formar el byte bajo.
Por ejemplo, si tiene el punto de código GB / T 2312 4566 ("外", [9] que significa externo), el byte alto usará el número de fila 45: 45 + 160 = 205 = 0xCD, y el byte bajo vienen de la columna, 66: 66 + 160 = 212 = 0xE2. Entonces, la codificación completa es 0xCDE2. [10]
HZ
HZ es otra codificación de GB 2312 que se usa principalmente para publicaciones de Usenet .
Gráficos de código
En las tablas siguientes, donde se da un par de números hexadecimales para un byte de prefijo o un byte de codificación, el más pequeño (con el octavo bit no establecido o no disponible) se usa cuando se codifica sobre GL ( 0x 21-0x7E), como en ISO- 2022-CN o HZ-GB-2312 , y el más grande (con el octavo bit configurado) se usa en el caso más típico de codificación sobre GR (0xA1-0xFE), como en EUC-CN , GBK o GB 18030 . Los números Qūwèi se dan en decimal.
Cuando GB / T 2312 se codifica sobre GR, ambos bytes tienen el octavo bit establecido (es decir, son mayores que 0x7F). GBK y GB 18030 también utilizan códigos de dos bytes en los que solo el primer byte tiene el octavo bit configurado para fines de extensión: dichos códigos están fuera del plano GB / T 2312 y no se tabulan aquí.
Byte de plomo
Este gráfico detalla el diseño general del plano principal del juego de caracteres GB / T 2312 por byte inicial. Para los bytes iniciales utilizados para caracteres que no sean hanzi , se proporcionan enlaces a gráficos en esta página que enumeran los caracteres codificados bajo ese byte inicial. Para los bytes iniciales utilizados para hanzi, se proporcionan enlaces a la sección correspondiente del índice hanzi de Wiktionary .
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2_ / A_ | SP [b] 0020 | Puntuar. PLOMO 1-_ | Lista LEAD 2-_ | Alnum. PLOMO 3-_ | Hiragana LEAD 4-_ | Katakana LEAD 5-_ | PLOMO griego 6-_ | PLOMO cirílico 7-_ | Phonet. PLOMO 8-_ | Caja PLOMO 9-_ | 10-_ | 11-_ | 12-_ | 13-_ | 14-_ | 15-_ |
3_ / B_ | Hanzi L1 PLOMO 16-_ | Hanzi L1 PLOMO 17-_ | Hanzi L1 PLOMO 18-_ | Hanzi L1 PLOMO 19-_ | Hanzi L1 PLOMO 20-_ | Hanzi L1 PLOMO 21-_ | Hanzi L1 PLOMO 22-_ | Hanzi L1 PLOMO 23-_ | Hanzi L1 PLOMO 24-_ | Hanzi L1 PLOMO 25-_ | Hanzi L1 PLOMO 26-_ | Hanzi L1 PLOMO 27-_ | Hanzi L1 PLOMO 28-_ | Hanzi L1 PLOMO 29-_ | Hanzi L1 PLOMO 30-_ | Hanzi L1 PLOMO 31-_ |
4_ / C_ | Hanzi L1 PLOMO 32-_ | Hanzi L1 PLOMO 33-_ | Hanzi L1 PLOMO 34-_ | Hanzi L1 PLOMO 35-_ | Hanzi L1 PLOMO 36-_ | Hanzi L1 PLOMO 37-_ | Hanzi L1 PLOMO 38-_ | Hanzi L1 PLOMO 39-_ | Hanzi L1 PLOMO 40-_ | Hanzi L1 PLOMO 41-_ | PLOMO Hanzi L1 42-_ | Hanzi L1 PLOMO 43-_ | Hanzi L1 PLOMO 44-_ | Hanzi L1 PLOMO 45-_ | Hanzi L1 PLOMO 46-_ | Hanzi L1 PLOMO 47-_ |
5_ / D_ | Hanzi L1 PLOMO 48-_ | Hanzi L1 PLOMO 49-_ | Hanzi L1 PLOMO 50-_ | Hanzi L1 PLOMO 51-_ | Hanzi L1 PLOMO 52-_ | Hanzi L1 PLOMO 53-_ | Hanzi L1 PLOMO 54-_ | Hanzi L1 PLOMO 55-_ | Hanzi L2 PLOMO 56-_ | PLOMO Hanzi L2 57-_ | PLOMO Hanzi L2 58-_ | Hanzi L2 PLOMO 59-_ | Hanzi L2 PLOMO 60-_ | PLOMO Hanzi L2 61-_ | Hanzi L2 PLOMO 62-_ | PLOMO Hanzi L2 63-_ |
6_ / E_ | Hanzi L2 PLOMO 64-_ | Hanzi L2 PLOMO 65-_ | PLOMO Hanzi L2 66-_ | PLOMO Hanzi L2 67-_ | Hanzi L2 PLOMO 68-_ | Hanzi L2 PLOMO 69-_ | Hanzi L2 PLOMO 70-_ | PLOMO Hanzi L2 71-_ | PLOMO Hanzi L2 72-_ | PLOMO Hanzi L2 73-_ | PLOMO Hanzi L2 74-_ | PLOMO Hanzi L2 75-_ | PLOMO Hanzi L2 76-_ | Hanzi L2 PLOMO 77-_ | Hanzi L2 PLOMO 78-_ | PLOMO Hanzi L2 79-_ |
7_ / F_ | PLOMO Hanzi L2 80-_ | PLOMO Hanzi L2 81-_ | Hanzi L2 PLOMO 82-_ | PLOMO Hanzi L2 83-_ | PLOMO Hanzi L2 84-_ | Hanzi L2 PLOMO 85-_ | PLOMO Hanzi L2 86-_ | PLOMO Hanzi L2 87-_ | 88-_ | 89-_ | 90-_ | 91-_ | 92-_ | 93-_ | 94-_ | DEL [b] 007F |
Letra Número Puntuación Símbolo Otro Indefinido
Filas que no son de Hanzi
Los siguientes gráficos enumeran los caracteres no hanzi disponibles en GB / T 2312, en GB / T 12345 y en la región 1 de doble byte de GB 18030 (que corresponde aproximadamente a la región no hanzi de GB / T 2312). Se toman notas donde estos difieren y donde GB 6345.1 e ISO-IR-165 difieren de estos. Se hacen referencias cruzadas a artículos sobre otros conjuntos de caracteres nacionales de CJK para su comparación.
Dos implementaciones de GB2312
EUC-CN | Subconjunto GBK / GB18030 | GB2312.TXT | Nombre del personaje [11] : 3 |
---|---|---|---|
A1A4 | U + 00B7 · PUNTO MEDIO | U + 30FB ・ KATAKANA MIDDLE DOT | 间隔 点; ' punto separador ' |
A1AA | U + 2014 - EM DASH | U + 2015 - BARRA HORIZONTAL | 破折号; ' em dash ' |
Asignaciones Unicode del interpunto ( chino :间隔 点; literalmente 'punto separador') y guión em ( chino :破折号) en el subconjunto de GBK y GB 18030 correspondientes a GB / T 2312 (U + 00B7 · PUNTO MEDIO yU + 2014 - EM DASH ) difieren de los que se enumeran en GB2312.TXT (U + 30FB ・ KATAKANA MIDDLE DOT yU + 2015 - HORIZONTAL BAR ), que es un archivo de datos proporcionado anteriormente por Unicode Consortium , [12] aunque ha sido designado como obsoleto desde agosto de 2011 [13] y ya no está alojado en septiembre de 2016.
A partir de 2015, Microsoft .Net Framework sigue las asignaciones GB 18030 al asignar esos dos caracteres en los datos etiquetados gb2312
, mientras que ICU , [14] iconv-1.14, [15] php-5.6, ActivePerl-5.20, Java 1.7 y Python 3.4 [16] siga GB2312.TXT en respuesta a la gb2312
etiqueta. Ruby 2.2 es compatible con ambas implementaciones; convierte internamente los personajes conflictivos al subconjunto GB 18030. La recomendación técnica de W3C / WHATWG para su uso con HTML5 especifica una codificación GBK que se infiere para los flujos etiquetados gb2312
, que a su vez utiliza un decodificador GB18030. [17]
Los proveedores individuales han definido y utilizado otras asignaciones diferentes, [12] incluido uno de Apple . [18]
Juego de caracteres 0x21 / 0xA1 (fila 1: puntuación y símbolos)
Esta fila contiene puntuación, operadores matemáticos y otros símbolos. La siguiente tabla muestra las asignaciones GB 18030 [19] para estos caracteres GB / T 2312 primero, seguidas de cualquier otra asignación documentada.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2_ / A_ | IDSP 3000 1-1 | 、 3001 1-2 | 。 3002 1-3 | · /・ 00B7 / 30FB 1-4 | ˉ 02C9 1-5 | 02C7 1-6 | ¨ 00A8 1-7 | 〃 3003 1-8 | 々 3005 1-9 | - / - 2014/2015 1-10 | ~ / 〜 FF5E / 301C 1-11 | ‖ / ∥ 2016/2225 1-12 | … / ⋯ 2026 / 22EF 1-13 | ' 2018 1-14 | ' 2019 1-15 | |
3_ / B_ | “ 201C 1-16 | ” 201D 1-17 | 〔 3014 1-18 | 〕 3015 1-19 | 〈 3008 1-20 | 〉 3009 1-21 | 《 300A 1-22 | 》 300B 1-23 | 「 300C 1-24 | 」 300D 1-25 | 『 300E 1-26 | 』 300F 1-27 | 〖 3016 1-28 | 〗 3017 1-29 | 【 3010 1-30 | 】 3011 1-31 |
4_ / C_ | ± 00B1 1-32 | × 00D7 1-33 | ÷ 00F7 1-34 | ∶ 2236 1-35 | ∧ 2227 1-36 | ∨ 2228 1-37 | ∑ 2211 1-38 | ∏ 220F 1-39 | ∪ 222A 1-40 | ∩ 2229 1-41 | ∈ 2208 1-42 | ∷ 2237 1-43 | √ 221A 1-44 | ⊥ 22A5 1-45 | ∥ 2225 1-46 | ∠ 2220 1-47 |
5_ / D_ | ⌒ 2312 1-48 | ⊙ 2299 1-49 | ∫ 222B 1-50 | ∮ 222E 1-51 | ≡ 2261 1-52 | ≌ 224C 1-53 | ≈ 2248 1-54 | ∽ 223D 1-55 | ∝ 221D 1-56 | ≠ 2260 1-57 | ≮ 226E 1-58 | ≯ 226F 1-59 | ≤ 2264 1-60 | ≥ 2265 1-61 | ∞ 221E 1-62 | ∵ 2235 1-63 |
6_ / E_ | ∴ 2234 1-64 | ♂ 2642 1-65 | ♀ 2640 1-66 | ° 00B0 1-67 | ′ 2032 1-68 | ″ 2033 1-69 | ℃ 2103 1-70 | $ FF04 1-71 | ¤ 00A4 1-72 | ¢ / ¢ FFE0 / 00A2 1-73 | £ / £ FFE1 / 00A3 1-74 | ‰ 2030 1-75 | § 00A7 1-76 | № 2116 1-77 | ☆ 2606 1-78 | ★ 2605 1-79 |
7_ / F_ | ○ 25CB 1-80 | ● 25CF 1-81 | ◎ 25CE 1-82 | ◇ 25C7 1-83 | ◆ 25C6 1-84 | □ 25A1 1-85 | ■ 25A0 1-86 | △ 25B3 1-87 | ▲ 25B2 1-88 | ※ 203B 1-89 | → 2192 1-90 | ← 2190 1-91 | ↑ 2191 1-92 | ↓ 2193 1-93 | 〓 3013 1-94 |
Letra Número Puntuación Símbolo Otro Indefinido
Juego de caracteres 0x22 / 0xA2 (fila 2: marcadores de lista)
Esta fila contiene varios tipos de marcadores de lista. Las formas minúsculas de los números romanos no se incluyeron en el documento GB / T 2312 [20] original ni en el documento GB / T 12345, [6] pero se incluyen tanto en la página de códigos de Windows 936 [21] como en el GB 18030 . [19] Una muestra euro se añadió también por GB 18030. [19]
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2_ / A_ | Ⅰ 2170 2-1 | Ⅱ 2171 2-2 | Ⅲ 2172 2-3 | Ⅳ 2173 2-4 | Ⅴ 2174 2-5 | Ⅵ 2175 2-6 | Ⅶ 2176 2-7 | Ⅷ 2177 2-8 | Ⅸ 2178 2-9 | Ⅹ 2179 2-10 | 2-11 | 2-12 | 2-13 | 2-14 | 2-15 | |
3_ / B_ | 2-16 | ⒈ 2488 2-17 | ⒉ 2489 2-18 | ⒊ 248A 2-19 | ⒋ 248B 2-20 | ⒌ 248C 2-21 | ⒍ 248D 2-22 | ⒎ 248E 2-23 | ⒏ 248F 2-24 | ⒐ 2490 2-25 | ⒑ 2491 2-26 | ⒒ 2492 2-27 | ⒓ 2493 2-28 | ⒔ 2494 2-29 | ⒕ 2495 2-30 | ⒖ 2496 2-31 |
4_ / C_ | ⒗ 2497 2-32 | ⒘ 2498 2-33 | ⒙ 2499 2-34 | ⒚ 249A 2-35 | ⒛ 249B 2-36 | ⑴ 2474 2-37 | ⑵ 2475 2-38 | ⑶ 2476 2-39 | ⑷ 2477 2-40 | ⑸ 2478 2-41 | ⑹ 2479 2-42 | ⑺ 247A 2-43 | ⑻ 247B 2-44 | ⑼ 247C 2-45 | ⑽ 247D 2-46 | ⑾ 247E 2-47 |
5_ / D_ | ⑿ 247F 2-48 | ⒀ 2480 2-49 | ⒁ 2481 2-50 | ⒂ 2482 2-51 | ⒃ 2483 2-52 | ⒄ 2484 2-53 | ⒅ 2485 2-54 | ⒆ 2486 2-55 | ⒇ 2487 2-56 | ① 2460 2-57 | ② 2461 2-58 | ③ 2462 2-59 | ④ 2463 2-60 | ⑤ 2464 2-61 | ⑥ 2465 2-62 | ⑦ 2466 2-63 |
6_ / E_ | ⑧ 2467 2-64 | ⑨ 2468 2-65 | ⑩ 2469 2-66 | € 20AC 2-67 | 2-68 | ㈠ 3220 2-69 | ㈡ 3221 2-70 | ㈢ 3222 2-71 | ㈣ 3223 2-72 | ㈤ 3224 2-73 | ㈥ 3225 2-74 | ㈦ 3226 2-75 | ㈧ 3227 2-76 | ㈨ 3228 2-77 | ㈩ 3229 2-78 | 2-79 |
7_ / F_ | 2-80 | Ⅰ 2160 2-81 | Ⅱ 2161 2-82 | Ⅲ 2162 2-83 | Ⅳ 2163 2-84 | Ⅴ 2164 2-85 | Ⅵ 2165 2-86 | Ⅶ 2166 2-87 | Ⅷ 2167 2-88 | Ⅸ 2168 2-89 | Ⅹ 2169 2-90 | Ⅺ 216A 2-91 | Ⅻ 216B 2-92 | 2-93 | 2-94 |
Letra Número Puntuación Símbolo Otro Indefinido
Juego de caracteres 0x23 / 0xA3 (fila 3: ISO 646-CN)
Esta fila contiene ISO 646-CN (GB / T 1988-80), una contraparte nacional de ASCII . Compare la fila 3 de KS X 1001 , que hace lo mismo con la versión ISO 646 de Corea del Sur , y la fila 3 de JIS X 0208 y de KPS 9566 , que incluyen solo el subconjunto alfanumérico, pero en el mismo diseño. La siguiente tabla enumera ISO 646-CN.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2_ / A_ | | ! 0021 3-1 | " 0022 3-2 | # 0023 3-3 | ¥ 00A5 3-4 | % 0025 3-5 | & 0026 3-6 | ' 0027 3-7 | ( 0028 3-8 | ) 0029 3-9 | * 002A 3-10 | + 002B 3-11 | , 002C 3-12 | - 002D 3-13 | . 002E 3-14 | / 002F 3-15 |
3_ / B_ | 0 0030 3-16 | 1 0031 3-17 | 2 0032 3-18 | 3 0033 3-19 | 4 0034 3-20 | 5 0035 3-21 | 6 0036 3-22 | 7 0037 3-23 | 8 0038 3-24 | 9 0039 3-25 | : 003A 3-26 | ; 003B 3-27 | < 003C 3-28 | = 003D 3-29 | > 003E 3-30 | ? 003F 3-31 |
4_ / C_ | @ 0040 3-32 | A 0041 3-33 | B 0042 3-34 | C 0043 3-35 | D 0044 3-36 | E 0045 3-37 | F 0046 3-38 | G 0047 3-39 | H 0048 3-40 | Yo 0049 3-41 | J 004A 3-42 | K 004B 3-43 | L 004C 3-44 | M 004D 3-45 | N 004E 3-46 | O 004F 3-47 |
5_ / D_ | P 0050 3-48 | Q 0051 3-49 | R 0052 3-50 | S 0053 3-51 | T 0054 3-52 | U 0055 3-53 | V 0056 3-54 | W 0057 3-55 | X 0058 3-56 | Y 0059 3-57 | Z 005A 3-58 | [ 005B 3-59 | \ 005C 3-60 | ] 005D 3-61 | ^ 005E 3-62 | _ 005F 3-63 |
6_ / E_ | ` 0060 3-64 | a 0061 3-65 | b 0062 3-66 | c 0063 3-67 | d 0064 3-68 | e 0065 3-69 | f 0066 3-70 | g 0067 3-71 | h 0068 3-72 | yo 0069 3-73 | j 006A 3-74 | k 006B 3-75 | l 006C 3-76 | m 006D 3-77 | n 006E 3-78 | o 006F 3-79 |
7_ / F_ | p 0070 3-80 | q 0071 3-81 | r 0072 3-82 | s 0073 3-83 | t 0074 3-84 | u 0075 3-85 | v 0076 3-86 | w 0077 3-87 | x 0078 3-88 | y 0079 3-89 | z 007A 3-90 | { 007B 3-91 | | 007C 3-92 | } 007D 3-93 | ‾ 203E 3-94 | |
Letra Número Puntuación Símbolo Otro Indefinido
Cuando se usa en una codificación que permite la combinación con ASCII como EUC-CN (y su superconjunto GB 18030 ), estos caracteres generalmente se implementan como caracteres de ancho completo , por lo tanto, las asignaciones al bloque de formularios de ancho medio y ancho completo se utilizan como se muestra a continuación. GB 6345.1 también maneja esta fila como de ancho completo y agrega los formularios de medio ancho (como arriba) como la fila 10. [1] Apple principalmente asigna esta fila a puntos de código de ancho completo como se muestra a continuación, pero usa asignaciones que no son de ancho completo para la línea superior y el signo de yuan como sobre. [18]
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2_ / A_ | ! FF01 3-1 | " FF02 3-2 | # FF03 3-3 | ¥ FFE5 3-4 | % FF05 3-5 | & FF06 3-6 | ' FF07 3-7 | ( FF08 3-8 | ) FF09 3-9 | * FF0A 3-10 | + FF0B 3-11 | , FF0C 3-12 | - FF0D 3-13 | . FF0E 3-14 | / FF0F 3-15 | |
3_ / B_ | 0 FF10 3-16 | 1 FF11 3-17 | 2 FF12 3-18 | 3 FF13 3-19 | 4 FF14 3-20 | 5 FF15 3-21 | 6 FF16 3-22 | 7 FF17 3-23 | 8 FF18 3-24 | 9 FF19 3-25 | : FF1A 3-26 | ; FF1B 3-27 | < FF1C 3-28 | = FF1D 3-29 | > FF1E 3-30 | ? FF1F 3-31 |
4_ / C_ | @ FF20 3-32 | A FF21 3-33 | B FF22 3-34 | C FF23 3-35 | D FF24 3-36 | E FF25 3-37 | F FF26 3-38 | G FF27 3-39 | H FF28 3-40 | I FF29 3-41 | J FF2A 3-42 | K FF2B 3-43 | L FF2C 3-44 | M FF2D 3-45 | N FF2E 3-46 | O FF2F 3-47 |
5_ / D_ | P FF30 3-48 | Q FF31 3-49 | R FF32 3-50 | S FF33 3-51 | T FF34 3-52 | U FF35 3-53 | V FF36 3-54 | W FF37 3-55 | X FF38 3-56 | Y FF39 3-57 | Z FF3A 3-58 | [ FF3B 3-59 | \ FF3C 3-60 | ] FF3D 3-61 | ^ FF3E 3-62 | _ FF3F 3-63 |
6_ / E_ | ` FF40 3-64 | a FF41 3-65 | b FF42 3-66 | c FF43 3-67 | d FF44 3-68 | e FF45 3-69 | f FF46 3-70 | g / ɡ [c] FF47 / 0261 3-71 | h FF48 3-72 | i FF49 3-73 | j FF4A 3-74 | k FF4B 3-75 | l FF4C 3-76 | m FF4D 3-77 | n FF4E 3-78 | o FF4F 3-79 |
7_ / F_ | p FF50 3-80 | q FF51 3-81 | r FF52 3-82 | s FF53 3-83 | t FF54 3-84 | u FF55 3-85 | v FF56 3-86 | w FF57 3-87 | x FF58 3-88 | y FF59 3-89 | z FF5A 3-90 | { FF5B 3-91 | | FF5C 3-92 | } FF5D 3-93 |  ̄ FFE3 3-94 |
Letra Número Puntuación Símbolo Otro Indefinido
Juego de caracteres 0x24 / 0xA4 (fila 4: Hiragana)
Este conjunto contiene Hiragana para escribir en japonés .
Compare con la fila 4 de JIS X 0208 , que coincide con esta fila, y con la fila 10 de KS X 1001 y KPS 9566 , que utilizan el mismo diseño, pero en una fila diferente.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2_ / A_ | ぁ 3041 4-1 | あ 3042 4-2 | ぃ 3043 4-3 | い 3044 4-4 | ぅ 3045 4-5 | う 3046 4-6 | ぇ 3047 4-7 | え 3048 4-8 | ぉ 3049 4-9 | お 304A 4-10 | か 304B 4-11 | が 304C 4-12 | き 304D 4-13 | ぎ 304E 4-14 | く 304F 4-15 | |
3_ / B_ | ぐ 3050 4-16 | け 3051 4-17 | げ 3052 4-18 | こ 3053 4-19 | ご 3054 4-20 | さ 3055 4-21 | ざ 3056 4-22 | し 3057 4-23 | じ 3058 4-24 | す 3059 4-25 | ず 305A 4-26 | せ 305B 4-27 | ぜ 305C 4-28 | そ 305D 4-29 | ぞ 305E 4-30 | た 305F 4-31 |
4_ / C_ | だ 3060 4-32 | ち 3061 4-33 | ぢ 3062 4-34 | っ 3063 4-35 | つ 3064 4-36 | づ 3065 4-37 | て 3066 4-38 | で 3067 4-39 | と 3068 4-40 | ど 3069 4-41 | な 306A 4-42 | に 306B 4-43 | ぬ 306C 4-44 | ね 306D 4-45 | の 306E 4-46 | は 306F 4-47 |
5_ / D_ | ば 3070 4-48 | ぱ 3071 4-49 | ひ 3072 4-50 | び 3073 4-51 | ぴ 3074 4-52 | ふ 3075 4-53 | ぶ 3076 4-54 | ぷ 3077 4-55 | へ 3078 4-56 | べ 3079 4-57 | ぺ 307A 4-58 | ほ 307B 4-59 | ぼ 307C 4-60 | ぽ 307D 4-61 | ま 307E 4-62 | み 307F 4-63 |
6_ / E_ | む 3080 4-64 | め 3081 4-65 | も 3082 4-66 | ゃ 3083 4-67 | や 3084 4-68 | ゅ 3085 4-69 | ゆ 3086 4-70 | ょ 3087 4-71 | よ 3088 4-72 | ら 3089 4-73 | り 308A 4-74 | る 308B 4-75 | れ 308C 4-76 | ろ 308D 4-77 | ゎ 308E 4-78 | わ 308F 4-79 |
7_ / F_ | ゐ 3090 4-80 | ゑ 3091 4-81 | を 3092 4-82 | ん 3093 4-83 | 4-84 | 4-85 | 4-86 | 4-87 | 4-88 | 4-89 | 4-90 | 4-91 | 4-92 | 4-93 | 4-94 |
Letra Número Puntuación Símbolo Otro Indefinido
Juego de caracteres 0x25 / 0xA5 (fila 5: Katakana)
Este conjunto contiene Katakana para escribir en japonés . Sin embargo, la marca de vocal larga japonesa , que se usa en el texto katakana y se incluye en la fila 1 de JIS X 0208 , no se incluye en GB / T 2312, aunque se agrega en GBK y GB 18030 fuera del GB / T 2312 principal plano, [23] en 0xA960. [19]
Compare con la fila 5 de JIS X 0208 , que coincide con esta fila, y con la fila 11 de KS X 1001 y KPS 9566 , que utilizan el mismo diseño, pero en una fila diferente.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2_ / A_ | ァ 30A1 5-1 | ア 30A2 5-2 | ィ 30A3 5-3 | イ 30A4 5-4 | ゥ 30A5 5-5 | ウ 30A6 5-6 | ェ 30A7 5-7 | エ 30A8 5-8 | ォ 30A9 5-9 | オ 30AA 5-10 | カ 30AB 5-11 | ガ 30AC 5-12 | キ 30AD 5-13 | ギ 30AE 5-14 | ク 30AF 5-15 | |
3_ / B_ | グ 30B0 5-16 | ケ 30B1 5-17 | ゲ 30B2 5-18 | コ 30B3 5-19 | ゴ 30B4 5-20 | サ 30B5 5-21 | ザ 30B6 5-22 | シ 30B7 5-23 | ジ 30B8 5-24 | ス 30B9 5-25 | ズ 30BA 5-26 | セ 30BB 5-27 | ゼ 30BC 5-28 | ソ 30BD 5-29 | ゾ 30BE 5-30 | タ 30BF 5-31 |
4_ / C_ | ダ 30C0 5-32 | チ 30C1 5-33 | ヂ 30C2 5-34 | ッ 30C3 5-35 | ツ 30C4 5-36 | ヅ 30C5 5-37 | テ 30C6 5-38 | デ 30C7 5-39 | ト 30C8 5-40 | ド 30C9 5-41 | ナ 30CA 5-42 | ニ 30CB 5-43 | ヌ 30CC 5-44 | ネ 30CD 5-45 | ノ 30CE 5-46 | ハ 30CF 5-47 |
5_ / D_ | バ 30D0 5-48 | パ 30D1 5-49 | ヒ 30D2 5-50 | ビ 30D3 5-51 | ピ 30D4 5-52 | フ 30D5 5-53 | ブ 30D6 5-54 | プ 30D7 5-55 | ヘ 30D8 5-56 | ベ 30D9 5-57 | ペ 30DA 5-58 | ホ 30DB 5-59 | ボ 30DC 5-60 | ポ 30DD 5-61 | マ 30DE 5-62 | ミ 30DF 5-63 |
6_ / E_ | ム 30E0 5-64 | メ 30E1 5-65 | モ 30E2 5-66 | ャ 30E3 5-67 | ヤ 30E4 5-68 | ュ 30E5 5-69 | ユ 30E6 5-70 | ョ 30E7 5-71 | ヨ 30E8 5-72 | ラ 30E9 5-73 | リ 30EA 5-74 | ル 30EB 5-75 | レ 30EC 5-76 | ロ 30ED 5-77 | ヮ 30EE 5-78 | ワ 30EF 5-79 |
7_ / F_ | ヰ 30F0 5-80 | ヱ 30F1 5-81 | ヲ 30F2 5-82 | ン 30F3 5-83 | ヴ 30F4 5-84 | ヵ 30F5 5-85 | ヶ 30F6 5-86 | 5-87 | 5-88 | 5-89 | 5-90 | 5-91 | 5-92 | 5-93 | 5-94 |
Letra Número Puntuación Símbolo Otro Indefinido
Juego de caracteres 0x26 / 0xA6 (fila 6: extensiones griegas y verticales)
Esta fila contiene soporte básico para el alfabeto griego moderno , sin signos diacríticos ni sigma final .
Los caracteres encuadrados son formas de presentación de signos de puntuación para escritura vertical y no están incluidos en GB / T 2312 propiamente dicho, pero están incluidos en esta fila en GB / T 12345, [1] [6] Mac OS Simplified Chinese, [18] y GB 18030. [19] Se consideran "extensiones estándar de GB 2312". [18] Por el contrario, ISO-IR-165 incluye caracteres semigráficos estampados en esta fila (en su mayoría sin contrapartes exactas en Unicode), chocando con las posiciones de código utilizadas para las extensiones verticales. [24]
Compare con la fila 6 de JIS X 0208 , que esta fila coincide cuando no se incluyen las formas verticales, y con la fila 6 de KPS 9566 , que incluye las mismas letras griegas en el mismo diseño, pero agrega números romanos en lugar de formas verticales. Contraste la fila 5 de KS X 1001 , que compensa las letras griegas para incluir primero los números romanos.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2_ / A_ | Α 0391 6-1 | Β 0392 6-2 | Γ 0393 6-3 | Δ 0394 6-4 | Ε 0395 6-5 | Ζ 0396 6-6 | Η 0397 6-7 | Θ 0398 6-8 | Ι 0399 6-9 | Κ 039A 6-10 | Λ 039B 6-11 | Μ 039C 6-12 | Ν 039D 6-13 | Ξ 039E 6-14 | Ο 039F 6-15 | |
3_ / B_ | Π 03A0 6-16 | Ρ 03A1 6-17 | Σ 03A3 6-18 | Τ 03A4 6-19 | Υ 03A5 6-20 | Φ 03A6 6-21 | Χ 03A7 6-22 | Ψ 03A8 6-23 | Ω 03A9 6-24 | 6-25 | 6-26 | 6-27 | 6-28 | 6-29 | 6-30 | 6-31 |
4_ / C_ | 6-32 | α 03B1 6-33 | β 03B2 6-34 | γ 03B3 6-35 | δ 03B4 6-36 | ε 03B5 6-37 | ζ 03B6 6-38 | η 03B7 6-39 | θ 03B8 6-40 | ι 03B9 6-41 | κ 03BA 6-42 | λ 03BB 6-43 | μ 03BC 6-44 | ν 03BD 6-45 | ξ 03BE 6-46 | ο 03BF 6-47 |
5_ / D_ | π 03C0 6-48 | ρ 03C1 6-49 | σ 03C3 6-50 | τ 03C4 6-51 | υ 03C5 6-52 | φ 03C6 6-53 | χ 03C7 6-54 | ψ 03C8 6-55 | ω 03C9 6-56 | ︐ [d] FE10 6-57 | ︒ [d] FE12 6-58 | ︑ [d] FE11 6-59 | ︓ [d] FE13 6-60 | ︔ [d] FE14 6-61 | ︕ [d] FE15 6-62 | ︖ [d] FE16 6-63 |
6_ / E_ | ︵ FE35 6-64 | ︶ FE36 6-65 | ︹ FE39 6-66 | ︺ FE3A 6-67 | ︿ FE3F 6-68 | ﹀ FE40 6-69 | ︽ FE3D 6-70 | ︾ FE3E 6-71 | ﹁ FE41 6-72 | ﹂ FE42 6-73 | ﹃ FE43 6-74 | ﹄ FE44 6-75 | ︗ [d] FE17 6-76 | ︘ [d] FE18 6-77 | ︻ FE3B 6-78 | ︼ FE3C 6-79 |
7_ / F_ | ︷ FE37 6-80 | ︸ FE38 6-81 | ︱ FE31 6-82 | ︙ [d] FE19 6-83 | ︳ FE33 6-84 | ︴ FE34 6-85 | 6-86 | 6-87 | 6-88 | 6-89 | 6-90 | 6-91 | 6-92 | 6-93 | 6-94 |
Letra Número Puntuación Símbolo Otro Indefinido
Juego de caracteres 0x27 / 0xA7 (fila 7: cirílico)
Este conjunto incluye ambos casos de 33 letras del alfabeto cirílico , suficientes para escribir el alfabeto ruso moderno y el alfabeto búlgaro , aunque otras formas del cirílico requieren letras adicionales. [25]
Compare con la fila 7 de JIS X 0208 , que coincide con esta fila, y con la fila 12 de KS X 1001 y la fila 5 de KPS 9566 , que utilizan el mismo diseño pero en filas diferentes.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2_ / A_ | А 0410 7-1 | Б 0411 7-2 | Â 0412 7-3 | Г 0413 7-4 | Д 0414 7-5 | Е 0415 7-6 | Ё 0401 7-7 | Ж 0416 7-8 | З 0417 7-9 | И 0418 7-10 | Й 0419 7-11 | К 041A 7-12 | Л 041B 7-13 | М 041C 7-14 | Н 041D 7-15 | |
3_ / B_ | О 041E 7-16 | П 041F 7-17 | Р 0420 7-18 | С 0421 7-19 | Т 0422 7-20 | У 0423 7-21 | Ф 0424 7-22 | Х 0425 7-23 | Ц 0426 7-24 | Ч 0427 7-25 | Ш 0428 7-26 | Щ 0429 7-27 | Ъ 042A 7-28 | Ы 042B 7-29 | Ь 042C 7-30 | Э 042D 7-31 |
4_ / C_ | Ю 042E 7-32 | Я 042F 7-33 | 7-34 | 7-35 | 7-36 | 7-37 | 7-38 | 7-39 | 7-40 | 7-41 | 7-42 | 7-43 | 7-44 | 7-45 | 7-46 | 7-47 |
5_ / D_ | 7-48 | а 0430 7-49 | б 0431 7-50 | в 0432 7-51 | г 0433 7-52 | д 0434 7-53 | е 0435 7-54 | ё 0451 7-55 | ж 0436 7-56 | з 0437 7-57 | и 0438 7-58 | © 0439 7-59 | к 043A 7-60 | л 043B 7-61 | м 043C 7-62 | н 043D 7-63 |
6_ / E_ | о 043E 7-64 | п 043F 7-65 | р 0440 7-66 | с 0441 7-67 | т 0442 7-68 | у 0443 7-69 | ф 0444 7-70 | х 0445 7-71 | ц 0446 7-72 | ч 0447 7-73 | ш 0448 7-74 | щ 0449 7-75 | ъ 044A 7-76 | ы 044B 7-77 | ь 044C 7-78 | э 044D 7-79 |
7_ / F_ | ю 044E 7-80 | я 044F 7-81 | 7-82 | 7-83 | 7-84 | 7-85 | 7-86 | 7-87 | 7-88 | 7-89 | 7-90 | 7-91 | 7-92 | 7-93 | 7-94 |
Letra Número Puntuación Símbolo Otro Indefinido
Juego de caracteres 0x28 / 0xA8 (fila 8: zhuyin y pinyin no ASCII)
Esta fila contiene caracteres bopomofo y pinyin , excluidas las letras ASCII (que están en la fila 3). Los caracteres en caja no están en el conjunto básico de GB 2312, pero se agregan en GB 6345.1 , [18] y también se incluyen en GB / T 12345, [1] [6] Mac OS Simplified Chinese [18] y GB 18030. [19] Ellos se consideran "extensiones estándar de GB 2312". [18]
GB 6345.1 trata el pinyin de esta fila como de ancho completo e incluye las contrapartes de medio ancho como la fila 11; [1] GB 18030 no hace esto.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2_ / A_ | ā 0101 8-1 | á 00E1 8-2 | ǎ 01CE 8-3 | à 00E0 8-4 | ē 0113 8-5 | é 00E9 8-6 | ě 011B 8-7 | è 00E8 8-8 | ī 012B 8-9 | í 00ED 8-10 | ǐ 01D0 8-11 | ì 00EC 8-12 | ō 014D 8-13 | ó 00F3 8-14 | ǒ 01D2 8-15 | |
3_ / B_ | ò 00F2 8-16 | ū 016B 8-17 | ú 00FA 8-18 | ǔ 01D4 8-19 | ù 00F9 8-20 | ǖ 01D6 8-21 | ǘ 01D8 8-22 | ǚ 01DA 8-23 | ǜ 01DC 8-24 | ü 00FC 8-25 | ê 00EA 8-26 | ɑ 0251 8-27 | ḿ [e] 1E3F 8-28 | ń 0144 8-29 | ň 0148 8-30 | ǹ [f] 01F9 8-31 |
4_ / C_ | ɡ / g[g] 0261 / FF47 8-32 | 8-33 | 8-34 | 8-35 | 8-36 | ㄅ 3105 8-37 | ㄆ 3106 8-38 | ㄇ 3107 8-39 | ㄈ 3108 8-40 | ㄉ 3109 8-41 | ㄊ 310A 8-42 | ㄋ 310B 8-43 | ㄌ 310C 8-44 | ㄍ 310D 8-45 | ㄎ 310E 8-46 | ㄏ 310F 8-47 |
5_ / D_ | ㄐ 3110 8-48 | ㄑ 3111 8-49 | ㄒ 3112 8-50 | ㄓ 3113 8-51 | ㄔ 3114 8-52 | ㄕ 3115 8-53 | ㄖ 3116 8-54 | ㄗ 3117 8-55 | ㄘ 3118 8-56 | ㄙ 3119 8-57 | ㄚ 311A 8-58 | ㄛ 311B 8-59 | ㄜ 311C 8-60 | ㄝ 311D 8-61 | ㄞ 311E 8-62 | ㄟ 311F 8-63 |
6_ / E_ | ㄠ 3120 8-64 | ㄡ 3121 8-65 | ㄢ 3122 8-66 | ㄣ 3123 8-67 | ㄤ 3124 8-68 | ㄥ 3125 8-69 | ㄦ 3126 8-70 | ㄧ 3127 8-71 | ㄨ 3128 8-72 | ㄩ 3129 8-73 | 8-74 | 8-75 | 8-76 | 8-77 | 8-78 | 8-79 |
7_ / F_ | 8-80 | 8-81 | 8-82 | 8-83 | 8-84 | 8-85 | 8-86 | 8-87 | 8-88 | 8-89 | 8-90 | 8-91 | 8-92 | 8-93 | 8-94 |
Letra Número Puntuación Símbolo Otro Indefinido
Juego de caracteres 0x29 / 0xA9 (fila 9: dibujo de caja)
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2_ / A_ | 9-1 | 9-2 | 9-3 | ─ 2500 9-4 | ━ 2501 9-5 | │ 2502 9-6 | ┃ 2503 9-7 | ┄ 2504 9-8 | ┅ 2505 9-9 | ┆ 2506 9-10 | ┇ 2507 9-11 | ┈ 2508 9-12 | ┉ 2509 9-13 | ┊ 250A 9-14 | ┋ 250B 9-15 | |
3_ / B_ | ┌ 250C 9-16 | ┍ 250D 9-17 | ┎ 250E 9-18 | ┏ 250F 9-19 | ┐ 2510 9-20 | ┑ 2511 9-21 | ┒ 2512 9-22 | ┓ 2513 9-23 | └ 2514 9-24 | ┕ 2515 9-25 | ┖ 2516 9-26 | ┗ 2517 9-27 | ┘ 2518 9-28 | ┙ 2519 9-29 | ┚ 251A 9-30 | ┛ 251B 9-31 |
4_ / C_ | ├ 251C 9-32 | ┝ 251D 9-33 | ┞ 251E 9-34 | ┟ 251F 9-35 | ┠ 2520 9-36 | ┡ 2521 9-37 | ┢ 2522 9-38 | ┣ 2523 9-39 | ┤ 2524 9-40 | ┥ 2525 9-41 | ┦ 2526 9-42 | ┧ 2527 9-43 | ┨ 2528 9-44 | ┩ 2529 9-45 | ┪ 252A 9-46 | ┫ 252B 9-47 |
5_ / D_ | ┬ 252C 9-48 | ┭ 252D 9-49 | ┮ 252E 9-50 | ┯ 252F 9-51 | ┰ 2530 9-52 | ┱ 2531 9-53 | ┲ 2532 9-54 | ┳ 2533 9-55 | ┴ 2534 9-56 | ┵ 2535 9-57 | ┶ 2536 9-58 | ┷ 2537 9-59 | ┸ 2538 9-60 | ┹ 2539 9-61 | ┺ 253A 9-62 | ┻ 253B 9-63 |
6_ / E_ | ┼ 253C 9-64 | ┽ 253D 9-65 | ┾ 253E 9-66 | ┿ 253F 9-67 | ╀ 2540 9-68 | ╁ 2541 9-69 | ╂ 2542 9-70 | ╃ 2543 9-71 | ╄ 2544 9-72 | ╅ 2545 9-73 | ╆ 2546 9-74 | ╇ 2547 9-75 | ╈ 2548 9-76 | ╉ 2549 9-77 | ╊ 254A 9-78 | ╋ 254B 9-79 |
7_ / F_ | 9-80 | 9-81 | 9-82 | 9-83 | 9-84 | 9-85 | 9-86 | 9-87 | 9-88 | 9-89 | 9-90 | 9-91 | 9-92 | 9-93 | 9-94 |
Letra Número Puntuación Símbolo Otro Indefinido
Filas Hanzi
Inclusión de caracteres chinos simplificados no estándar y caracteres chinos tradicionales
GB / T 2312 incluyó 2 caracteres chinos simplificados no estándar :
- 渖(68–41): simplificado de “审 [審] ”, pero la lista completa de caracteres simplificados ( chino :简化字 总 表; pinyin : Jiǎnhuà Zì Zǒng Biǎo ) ha fusionado “瀋” con “沈”. Las versiones antiguas de Xinhua Zidian ( chino :新华字典; pinyin : Xinhua Zìdiǎn ) habían incluido esta palabra y señalado como el zumo ( chino :汁; pinyin : Zhi ), nuevas versiones y ha cancelado esto y fusionado “渖” con “沈”. [27]
- 镟(79–64): simplificado de “钅 [釒] ”, pero la lista completa de caracteres simplificados ha combinado “鏇” con “旋”.
GB / T 2312 también incluyó 3 caracteres chinos tradicionales :
- 鍾(79–81): El documento original usaba el carácter "鍾" con la parte tradicional, pero la Lista completa de caracteres simplificados ha fusionado "鍾" con "鐘" y se ha simplificado a "钟", las plantillas posteriores cambiaron la palabra a "锺”. [nota 1]
- 後(65–65): El carácter se fusionó con “后” (26-83) en la Lista completa de caracteres simplificados y no tenía notas sobre el uso poco claro, pero GB / T 2312 había incluido este carácter. [28]
- 麴(84–80): El documento original usaba el carácter “麴” con la parte tradicional, pero la Lista completa de caracteres simplificados ha establecido que “麥” debe simplificarse a “麦”; el correspondiente carácter chino simplificado “麹” fue sometido a Unicode por Japón como Shinjitai “麹”. La lista completa de caracteres simplificados incluyó “麹” en 2013: 7748.
Correcciones
GB 5007.1-85 24x24 Fuente de mapa de bits Conjunto de caracteres chinos para intercambio de información ( chino :信息 交换 用 汉字 24x24 点阵 字模 集) que es una plantilla de fuente basada en GB / T 2312 que ha incluido algunas correcciones que incluyen:
- cambiar la forma de glifo del alfabeto latino "g"
- agregando 6 caracteres Hanyu Pinyin : ɑ , ḿ , ń , ň , ǹ , ɡ [nota 2]
- cambió “鍾” a “锺”, cambió “麴” a “麹”
- incluyó 94 glifos de ancho medio en la fila 10 (forma de ancho medio de la fila 3, equivalente a GB 1988–80
- incluyó la forma de ancho medio de 32 caracteres Hanyu Pinyin de la fila 8 en la fila 11.
GB / T 2312 no tuvo correcciones, pero estas correcciones se incluyen en plantillas de fuentes basadas en GB / T 2312, incluido GB / T 12345; sus superconjuntos GBK y GB 18030 también incluyeron estas correcciones. GB / T 2312 también se utiliza en ISO-IR-165 .
Ver también
- Código Guobiao
- CJK
- Codificación de caracteres chinos
- Unicode
- Big5 : estándar utilizado en Taiwán y Hong Kong
- GB 18030 , que reemplazó a GB / T 2312-1980
- GB / T 12345-1990, homólogo tradicional de GB / T 2312-1980, reemplazado por GB18030
Referencias
- ↑ a b c d e f Lunde, Ken (2009). Procesamiento de información CJKV: Computación china, japonesa, coreana y vietnamita (2ª ed.). Sebastopol, CA : O'Reilly . págs. 94-111. ISBN 978-0-596-51447-1.
- ^ "2017 年 第 7 号 中国 国家 标准 公告 (China National Standard Bulletin 2017 No.7)" . Administración de Normalización de la República Popular China . Consultado el 3 de julio de 2018 .
- ^ "Distribución de codificaciones de caracteres entre sitios web que utilizan China y territorios" . w3techs.com . Consultado el 1 de marzo de 2021 .
- ^ "Tendencias históricas en el uso de codificaciones de caracteres, junio de 2020" . w3techs.com . Consultado el 1 de junio de 2020 .
- ^ "Codificación: resultados de prueba resumidos" . www.w3.org . Consultado el 15 de noviembre de 2019 .
- ^ a b c d Lunde, Ken (1998). Apéndice F: GB / T 12345 (PDF) . Procesamiento de información CJKV . O'Reilly Media . ISBN 9781565922242.
- ^ GB12345-80 a la tabla Unicode . Consorcio Unicode . 1993-12-06. Archivado desde el original el 17 de junio de 2004.
- ^ Hannas, William C. (1997). El dilema ortográfico de Asia . University of Hawai'i Press. pag. 264.
el conjunto proporciona más del 99,99 por ciento de todo el uso. Sin embargo, los diseñadores encontraron necesario agregar 14,276 caracteres de "uso especial" para cubrir contingencias.
- ^ https://archive.org/details/GB2312-1980/page/n17
- ^ https://web.archive.org/web/20160303230643/http://cs.nyu.edu/~yusuke/tools/unicode_to_gb2312_or_gbk_table.html
- ^ "GB 2312-1980: Tecnología de la información: conjunto de caracteres codificados con ideograma chino para el intercambio de información (conjunto básico)" . Consultado el 2 de octubre de 2016 .
- ^ a b Haible, Bruno. "GB2312 (tablas de conversión)" . Consultado el 29 de septiembre de 2016 .
- ^ "Léame - MAPAS / OBSOLETO / EASTASIA" . 9 de agosto de 2001 . Consultado el 29 de septiembre de 2016 .
- ^ "java-EUC_CN-1.3_P.ucm" . Consultado el 29 de septiembre de 2016 .[ enlace muerto permanente ]
- ^ "libiconv: lib / gb2312.h" . GNU Savannah . Consultado el 29 de septiembre de 2016 .
- ^ "Edición 24036" . Rastreador de errores de Python .
- ^ "Codificación § Nombres y etiquetas" . W3C . Consultado el 29 de septiembre de 2016 .
- ^ a b c d e f g h yo j "Mapa (versión externa) de la codificación simplificada de chino de Mac OS a Unicode 3.0 y posterior" . Apple, Inc .
- ^ a b c d e f g h yo j Administración de Normalización de China (SAC) (2005-11-18). GB 18030-2005: Tecnología de la información: conjunto de caracteres codificados en chino .
- ^ Asociación China de Normalización . Juego de caracteres gráficos codificados en chino para el intercambio de información (PDF) . ITSCJ / IPSJ . ISO-IR -68.
- ^ Microsoft . "CODEPAGE 936: PRC GBK (XGB) - ANSI, OEM" . Consorcio Unicode .
- ^ a b Viswanadha, Raghuram (30 de agosto de 2000). "Tabla Unicode a ISO-IR-165" . Componentes internacionales para Unicode . IBM .
- ^ Lunde, Ken (2009). "Personajes aparentemente desaparecidos". Procesamiento de información CJKV: Computación china, japonesa, coreana y vietnamita (2ª ed.). Sebastopol, CA : O'Reilly . pag. 180. ISBN 978-0-596-51447-1.
- ^ a b CCITT (13 de julio de 1992). Códigos del juego de caracteres gráficos chinos para la comunicación (PDF) . ITSCJ / IPSJ . ISO-IR -165.
- ^ Czyborra, Roman (30 de noviembre de 1998) [25 de mayo de 1998]. "La sopa de caracteres cirílicos" . Archivado desde el original el 3 de diciembre de 2016 . Consultado el 3 de diciembre de 2016 .
- ^ "Políticas de estabilidad de codificación de caracteres Unicode" . Consorcio Unicode. 2017-06-23.
- ^ "「 瀋 」的 類推 簡化「 渖 」用於 甚麼 場合? - 知 乎" . www.zhihu.com (en chino) . Consultado el 22 de diciembre de 2020 .
- ^ "GB2312 字符 集 为何 有「 後 」字? - 知 乎" . www.zhihu.com (en chino) . Consultado el 22 de diciembre de 2020 .
Notas
- ^ Solo para ideogramas cubiertos por GB / T 2312, todos los cuales caen en Unicode BMP
- ^ a b Como un conjunto de 94 n caracteres compatible con ISO 2022 , el espacio sin formato y el carácter de eliminación están disponibles como códigos de un solo byte en 0x20 y 0x7F (no 0xA0 y 0xFF) respectivamente.
- ^ Usado para U + FF47 por GB 6345.1 y GB 18030 (que usan 8-32 para U + 0261), [19] pero para U + 0261 por ISO-IR-165 . [22] El glifo de referencia GB 2312-80 original se parecía a U + 0261, pero fue modificado por GB 6345.1. [1]
- ^ a b c d e f g h i j Estos caracteres son del bloque de formas verticales . Algunas asignaciones en uso se diseñaron cuando las únicas formas de presentación vertical que existían en Unicode eran las del bloque CJK Compatibility Forms . Específicamente, GB 18030 los asigna al Área de uso privado , pero con un glifo definido, [19] y Apple al carácter regular de ancho completo con un carácter de uso privado adjunto U + F87E como marcador de variación. [18]
- ^ Asignado al área de uso privadoU + E7C7 por la primera edición (2000) de GB 18030 ; esto fue enmendado por la edición de 2005. [19]
- ^ Este carácter compuesto se agregó en Unicode 3.0. Antes de esto, este personaje se asignó a su secuencia de composición (es decir, U + 006E + 0300 ) de Apple. [18] Este cambio es anterior a la estabilización de las formas de normalización Unicode , que se introdujo en Unicode 3.1. [26]
- ^ Usado para U + 0261 en GB 6345.1 [18] y GB 18030 [19] (que usan 3-71 para U + FF47), pero para U + FF47 en ISO-IR-165. [22] [24]
- ^ Lista de formas de caracteres de caracteres chinos comunes para publicación ( chino :印刷 通用 汉字 字形 表; pinyin : Yìnshuà Tōngyòng Hànzì Zìxíngbiǎo ) en 1964 señaló que锺se puede usar en nombres y citas de textos chinos clásicos, Tabla de caracteres chinos estándar generales ( Chino :通用 規範 漢字 表; pinyin : Tōngyòng Guīfàn Hànzì Biǎo ) en 2013 ha aceptado锺(2013: 7679) para su uso en nombres.
- ^ ɑ (U + 0251)
ḿ (U + 1E3F ; Enviado en Unicode 3.0, por lo que CP936 no incluyó este carácter [1] [ enlace muerto permanente ] )
ń (U + 0144)
ň (U + 0148)
ǹ (U + 01F9 ; Enviado en Unicode 3.0, por lo que CP936 no incluyó este carácter [2] [ enlace muerto permanente ] )
ɡ (U + 0261)
Otras lecturas
- Lunde, Ken (2009). "Estándares de juegos de caracteres chinos: China" . Procesamiento de información CJKV (2ª ed.). O'Reilly. ISBN 978-0-596-51447-1.
enlaces externos
- Vista gráfica de GB2312 en el Explorador de convertidores de ICU
- Unicode a GB2312 o tabla GBK
- Códigos de caracteres chinos
- Evolución de GBK y GB2312 en GB18030
- Juego de caracteres GB2312 para caracteres chinos
- Juego de caracteres gráficos chinos codificados para el intercambio de información ISO-IR 58
- El código C genera 6763 caracteres básicos con salida
- Estándar GB2312-80 en China-Language.gov.cn