VSCII ( Código estándar vietnamita para el intercambio de información ), también conocido como TCVN 5712 , [2] ISO-IR-180 , [3] .VN , [4] ABC [4] o simplemente las codificaciones TCVN , [4] [5] es un conjunto de tres codificaciones de caracteres estándar vietnamitas estrechamente relacionadas para usar el idioma vietnamita con computadoras , desarrollado por el Comité Técnico de Tecnología de la Información de TCVN (TCVN / TC1) y adoptado por primera vez en 1993 (como TCVN 5712: 1993). [2]
Alias | x-viet-tcvn5712 [1] |
---|---|
Idioma (s) | Vietnamita , inglés |
Creado por | TCVN / TC1 |
Estándar | TCVN 5712: 1993 |
Clasificación | SBCS de 8 bits ; ASCII extendido (VSCII-2 / -3) |
No debe confundirse con la codificación VISCII no oficial de nombre similar , que a veces era utilizada por hablantes de vietnamita en el extranjero. [4] VISCII también estaba destinado a significar el Código estándar vietnamita para el intercambio de información , pero no está relacionado con VSCII. [6]
VSCII (TCVN) se utilizó ampliamente en el norte de Vietnam, mientras que VNI fue popular en el sur. [4] Unicode y la página de códigos de Windows-1258 ahora se utilizan para prácticamente todos los datos informáticos vietnamitas, [ cita requerida ] pero los archivos heredados o los mensajes archivados pueden necesitar conversión.
Codificaciones
Las tres formas de VSCII mantienen los 95 caracteres imprimibles de ASCII sin modificar.
VSCII-3 , también conocido como TCVN 5712-3, VN3 o simplemente TCVN3, [7] incluye la menor cantidad de asignaciones. Es un ASCII extendido , porque mantiene los 128 códigos de ASCII sin modificar. No reasigna ninguno de los códigos de control C0 y C1 . En comparación con ASCII , agrega 75 caracteres:
- 67 caracteres en minúscula, lo que permite un soporte completo en minúsculas.
- 7 caracteres en mayúscula, lo que permite la compatibilidad con mayúsculas para las 29 letras base sin marcas de tono.
- El espacio que no se rompe .
Las marcas de tono en las vocales mayúsculas se logran en TCVN3 al cambiar a una fuente en mayúsculas. [8]
VSCII-2 , también conocido como TCVN 5712-2 y VN2, es un superconjunto de VSCII-3. Es un ASCII extendido , porque mantiene los 128 códigos de ASCII sin modificar. No reasigna ninguno de los códigos de control C0 y C1 , lo que lo hace conforme con ISO 2022 como un conjunto de 96. [2] [3] En comparación con VSCII-3, agrega (para un total de 96 caracteres no ASCII):
- 16 caracteres más en mayúsculas con marcas de tono compuestas previamente (para un total de 23 caracteres en mayúsculas no ASCII)
- 5 combinando diacríticos para marcas de tono , permitiendo representar otras combinaciones de letras mayúsculas y marcas de tono. Las marcas de combinación siguen a la letra base [2] como en VNI (en lugar de precederlas como en ANSEL ).
VSCII-1 , también conocido como TCVN 5712-1 y VN1, es una extensión de VSCII-2 y es un ASCII modificado, ya que reemplaza 12 de los 33 caracteres de control con caracteres precompuestos. En comparación con VSCII-2, (para un total de 140 caracteres no ASCII):
- Agrega 44 letras mayúsculas más precompuestas, con lo que cuentan con la misma cantidad que las minúsculas
- Lo hace reemplazando 12 caracteres de control ASCII y asignando 32 caracteres gráficos al área de control C1, rompiendo la compatibilidad con ISO 2022
La conversión de VSCII-3 a VSCII-2 o VSCII-1 y la conversión de VSCII-2 a VSCII-1 no son necesarias, pero pueden generar archivos más pequeños.
La conversión de VSCII-1 a VSCII-2 o VSCII-3 y la conversión de VSCII-2 a VSCII-3 requieren la expansión de algunos caracteres precompuestos.
Conjunto de caracteres
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 | NUL 0000 | Ú 00DA | Ụ 1EE4 | ETX 0003 | Ừ 1EEA | Ử 1EEC | Ữ 1EEE | BEL 0007 | BS 0008 | HT 0009 | LF 000A | VT 000B | FF 000C | CR 000D | SO 000E | SI 000F |
1_ 16 | DLE 0010 | Ứ 1EE8 | Ự 1EF0 | Ỳ 1EF2 | Ỷ 1EF6 | Ỹ 1EF8 | Ý 00DD | Ỵ 1EF4 | PUEDE 0018 | EM 0019 | SUB 001A | ESC 001B | FS 001C | GS 001D | RS 001E | US 001F |
2_ 32 | SP 0020 | ! 0021 | " 0022 | # 0023 | $ 0024 | % 0025 | & 0026 | « 0027 | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
3_ 48 | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
4_ 64 | @ 0040 | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | Yo 0049 | J 004A | K 004B | L 004C | M 004D | N 004E | O 004F |
5_ 80 | P 0050 | Q 0051 | R 0052 | S 0053 | T 0054 | U 0055 | V 0056 | W 0057 | X 0058 | Y 0059 | Z 005A | [ 005B | \ 005C | ] 005D | ^ 005E | _ 005F |
6_ 96 | ` 0060 | un 0061 | b 0062 | c 0063 | d 0064 | e 0065 | f 0066 | g 0067 | h 0068 | yo 0069 | j 006A | k 006B | l 006C | m 006D | n 006E | o 006F |
7_ 112 | p 0070 | q 0071 | r 0072 | s 0073 | t 0074 | u 0075 | v 0076 | w 0077 | x 0078 | y 0079 | z 007A | { 007B | | 007C | } 007D | ~ 007E | DEL 007F |
8_ 128 | À 00C0 | Ả 1EA2 | Ã 00C3 | Á 00C1 | Ạ 1EA0 | Ặ 1EB6 | Ậ 1EAC | È 00C8 | Ẻ 1EBA | Ẽ 1EBC | É 00C9 | Ẹ 1EB8 | Ệ 1EC6 | Ì 00CC | Ỉ 1EC8 | Ĩ 0128 |
9_ 144 | Í 00CD | Ị 1ECA | Ò 00D2 | Ỏ 1ECE | Õ 00D5 | Ó 00D3 | Ọ 1ECC | Ộ 1ED8 | Ờ 1EDC | Ở 1EDE | Ỡ 1EE0 | Ớ 1EDA | Ợ 1EE2 | Ù 00D9 | Ủ 1EE6 | × 0168 |
A_ 160 | NBSP 00A0 | Ă 0102 | Â 00C2 | Ê 00CA | Ô 00D4 | Ơ 01A0 | Ư 01AF | Đ 0110 | ă 0103 | â 00E2 | ê 00EA | ô 00F4 | ơ 01A1 | ư 01B0 | đ 0111 | Ằ 1EB0 |
B_ 176 | 0300 | ̉ 0309 | 0303 | 0301 | ̣ 0323 | à 00E0 | ả 1EA3 | ã 00E3 | á 00E1 | ạ 1EA1 | Ẳ 1EB2 | ằ 1EB1 | ẳ 1EB3 | ẵ 1EB5 | ắ 1EAF | Ẵ 1EB4 |
C_ 192 | Ắ 1EAE | Ầ 1EA6 | Ẩ 1EA8 | Ẫ 1EAA | Ấ 1EA4 | Ề 1EC0 | Â 1EB7 | ầ 1EA7 | ẩ 1EA9 | ẫ 1EAB | ấ 1EA5 | Â 1EAD | è 00E8 | Ể 1EC2 | ẻ 1EBB | ẽ 1EBD |
D_ 208 | é 00E9 | E 1EB9 | ề 1EC1 | ể 1EC3 | ễ 1EC5 | E 1EBF | E 1EC7 | ì 00EC | ỉ 1EC9 | Ễ 1EC4 | Ế 1EBE | Ồ 1ED2 | ĩ 0129 | í 00ED | ị 1ECB | ò 00F2 |
E_ 224 | Ổ 1ED4 | ỏ 1ECF | õ 00F5 | ó 00F3 | ọ 1ECD | ồ 1ED3 | ổ 1ED5 | ỗ 1ED7 | ố 1ED1 | ộ 1ED9 | ờ 1EDD | ở 1EDF | ỡ 1EE1 | ớ 1EDB | ợ 1EE3 | ù 00F9 |
F_ 240 | Ỗ 1ED6 | ủ 1EE7 | ũ 0169 | ú 00FA | ụ 1EE5 | ừ 1EEB | ử 1EED | ữ 1EEF | ứ 1EE9 | ự 1EF1 | ỳ 1EF3 | ÿ 1EF7 | ỹ 1EF9 | ý 00FD | ỵ 1EF5 | Ố 1ED0 |
Letra Número Puntuación Símbolo Otro Indefinido
El sombreado de tablero de ajedrez indica caracteres que no están en VSCII-3. Los caracteres sombreados en las filas 0_, 1_, 8_ y 9_ no están en VSCII-2 o VSCII-3. [9]
Referencias
- ↑ Sivonen, Henri (26 de septiembre de 2014). "Los cambios de codificación de caracteres en mc requieren acción cc" . mozilla.dev.apps.thunderbird .
- ^ a b c d e "[noticias] TCVN 5712: 1993 (VSCII) - Norma nacional vietnamita" . 1993-06-02. Archivado desde el original el 11 de enero de 2017.
- ^ a b TVCN (1993). "ISO-IR-180: parte derecha de la tabla de códigos VSCII-2" (PDF) . ITSCJ / IPSJ .
- ^ a b c d e Ngo, Hoc Dinh; Tran, TuBinh. "5. ¿Por qué tener conversión de juego de caracteres vietnamita (juego de caracteres - codificación)?" . Algunas funciones especiales de WinVNKey .
- ^ Nguyen, Minh T. "Conversiones vietnamitas (Vietnet / VIQR, VNI, VPS, VISCII, VNU, TCVN, VietWare, unicode)" .
- ^ Lunde, Ken. "Capítulo 1: Descripción general del procesamiento de información CJKV (§ ¿VISCII y VSCII son idénticos? ¿Qué pasa con TCVN?)". Procesamiento de información CJKV (2ª ed.). pag. 17. ISBN 978-0-596-51447-1.
- ^ "Codificaciones de caracteres heredados Unicode y vietnamita" . Preguntas frecuentes sobre Unicode vietnamita .
- ^ "Codificaciones de caracteres heredados Unicode y vietnamita" . Preguntas frecuentes sobre Unicode vietnamita .
TCVN3 no es de doble byte, pero debido a la naturaleza de su codificación, las letras mayúsculas (vocales) se asignan a una fuente mayúscula separada que es similar a la normal en minúsculas.
- ^ Lunde, Ken. "Apéndice L: juegos de caracteres vietnamitas" (PDF) . Procesamiento de información CJKV (2ª ed.). ISBN 978-0-596-51447-1.
enlaces externos
- Gráficos en Librewiki
- Gráficos en Charset Wiki
- tablas con puntos y nombres Unicode