VISCII es una codificación de caracteres ASCII modificada definida no oficialmente para usar el idioma vietnamita con computadoras . No debe confundirse con la codificación VSCII registrada oficialmente con un nombre similar . VISCII mantiene los 95 caracteres imprimibles de ASCII sin modificar, pero reemplaza 6 de los 33 caracteres de control con caracteres imprimibles. Agrega 128 caracteres precompuestos . Unicode y la página de códigos de Windows-1258 ahora se utilizan para prácticamente todos los datos informáticos vietnamitas, [ cita requerida ] pero los archivos VSCII y VISCII heredados pueden necesitar conversión.
MIME / IANA | VISCII |
---|---|
Idioma (s) | Vietnamita , inglés |
Creado por | Grupo Viet-Std |
Definiciones | RFC 1456 |
Clasificación | SBCS de 8 bits |
Residencia en | ASCII |
Historia y naming
VISCII fue diseñado por el Vietnamese Standardization Working Group (Viet-Std Group) [1] con sede en Silicon Valley , California en 1992 mientras trabajaban con el consorcio Unicode para incluir caracteres vietnamitas precompuestos en el estándar Unicode. VISCII, junto con VIQR , se publicó por primera vez en un informe bilingüe en septiembre de 1992, en el que se denominó "Código estándar vietnamita para el intercambio de información". [2] El informe señaló una proliferación en el uso de computadoras en Vietnam, que las aplicaciones existentes usaban codificaciones específicas del proveedor que no podían interoperar entre sí y que , por lo tanto, era necesaria la estandarización entre proveedores. [2]
Al año siguiente, en 1993, Vietnam adoptó TCVN 5712 , su primer estándar nacional en el dominio de la tecnología de la información . [3] Esto define una codificación de caracteres nombrado VSCII , que había sido desarrollado por el TCVN Comité Técnico de Tecnología de la Información (TCVN / TC1), y con su nombre que significa "Código Estándar vietnamita para el Intercambio de Información". [3] VSCII es incompatible con el VISCII publicado anteriormente y no está relacionado con él. [4] A diferencia de VISCII, VSCII es un "estándar vietnamita" en el sentido de estándar nacional .
VISCII y VIQR fueron aprobados como estado informativo RFC 1456 , atribuido al grupo Viet-Std y fechado en mayo de 1993. Este RFC señala que son "convenciones" utilizadas por hablantes de vietnamita en el extranjero en Usenet , y que "no especifica ningún nivel de estándar". A pesar de esto, continúa llamando a VISCII el "Código estándar de VIetnamese para el intercambio de información" (el mismo nombre que toma VSCII). [5] Las etiquetas VISCII
y csVISCII
están registradas en IANA para VISCII, con referencia a RFC 1456. [6] (Por otro lado, no existe una etiqueta oficial de IANA para TCVN 5712 / VSCII, aunque x-viet-tcvn5712
anteriormente era compatible con Mozilla Firefox . [7] )
Diseño
Un conjunto de caracteres ASCII extendido tradicional consta del conjunto ASCII más hasta 128 caracteres. El vietnamita requiere 134 combinaciones de letras y diacríticos adicionales, que son seis de más. Hay ( salvo eliminar el soporte de marca de tono para letras mayúsculas, como en VSCII-3 ) esencialmente cuatro formas diferentes de manejar este problema:
- Utilice codificación de ancho variable (al igual que UTF-8 )
- Incluya la combinación de marcas diacríticas para marcas de tono (como hacen VSCII-2 y Windows-1258 ) o para diacríticos en general (como ANSEL y VNI )
- Reemplace algunos signos de puntuación ASCII, preferiblemente signos de puntuación que no sean invariantes en ISO 646 (al igual que VNI para DOS )
- Reemplace al menos seis de los caracteres de control ASCII básicos (al igual que VPS y VSCII-1 )
VISCII optó por la última opción, reemplazando seis de los códigos de control C0 (STX, ENQ, ACK, DC4, EM y RS) menos problemáticos (por ejemplo, los que tienen menos probabilidades de ser reconocidos por una aplicación y de que se actúe especialmente ) con seis de los combinaciones de letras mayúsculas y diacríticas menos utilizadas. [2] Si bien esta opción puede hacer que los programas que usan esos códigos de control no funcionen correctamente al manejar el texto VISCII, crea menos complicaciones que las otras dos opciones (los diseñadores señalan que se ha descubierto que la transmisión limpia que no es de 8 bits plantea más dificultades en práctica que la reutilización del carácter de control). [2] No obstante, las ubicaciones de los caracteres de control C0 o C1 y los códigos utilizados para el espacio no divisible en ISO-8859-1 , Mac OS Roman y OEM-US se asignaron deliberadamente a letras mayúsculas, con la intención de hacer uso de puntos de código en minúsculas con una fuente en mayúsculas, una solución alternativa útil si los caracteres gráficos no se pueden mostrar para esos códigos. [2]
Sin embargo, el uso de todos los puntos de código extendido para letras acentuadas no dejaba espacio para agregar símbolos útiles, números en superíndice, comillas curvas, guiones adecuados, etc., como la mayoría de los otros conjuntos de caracteres ASCII extendidos.
La ubicación de los caracteres sigue deliberadamente en su mayoría ISO-8859-1 donde hay caracteres en común entre las dos páginas de códigos (la mayúscula Õ se señala como una excepción), motivada por preocupaciones de facilidad de uso. [2]
Apoyo
VISCII cuenta con el apoyo parcial de TriChlor Software Group en California, que ha lanzado varios paquetes de software, bibliotecas y fuentes compatibles con VISCII para MS-DOS y Windows, Unix y Macintosh. El software compatible con VISCII está disponible en muchos sitios FTP .
VISCII se ofreció históricamente como una codificación para el correo electrónico saliente por Mozilla Thunderbird . [8]
VISCII fue utilizado principalmente por hablantes de vietnamita en el extranjero, siendo VSCII (TCVN) más popular en el norte de Vietnam y VNI más popular en el sur de Vietnam. [9]
Conjunto de caracteres
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 | NUL 0000 | SOH 0001 | Ẳ 1EB2 | ETX 0003 | EOT 0004 | Ẵ 1EB4 | Ẫ 1EAA | BEL 0007 | BS 0008 | HT 0009 | LF 000A | VT 000B | FF 000C | CR 000D | SO 000E | SI 000F |
1_ 16 | DLE 0010 | DC1 0011 | DC2 0012 | DC3 0013 | Ỷ 1EF6 | NAK 0015 | SYN 0016 | ETB 0017 | PUEDE 0018 | Ỹ 1EF8 | SUB 001A | ESC 001B | FS 001C | GS 001D | Ỵ 1EF4 | US 001F |
2_ 32 | SP 0020 | ! 0021 | " 0022 | # 0023 | $ 0024 | % 0025 | & 0026 | « 0027 | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
3_ 48 | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
4_ 64 | @ 0040 | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | Yo 0049 | J 004A | K 004B | L 004C | M 004D | N 004E | O 004F |
5_ 80 | P 0050 | Q 0051 | R 0052 | S 0053 | T 0054 | U 0055 | V 0056 | W 0057 | X 0058 | Y 0059 | Z 005A | [ 005B | \ 005C | ] 005D | ^ 005E | _ 005F |
6_ 96 | ` 0060 | un 0061 | b 0062 | c 0063 | d 0064 | e 0065 | f 0066 | g 0067 | h 0068 | yo 0069 | j 006A | k 006B | l 006C | m 006D | n 006E | o 006F |
7_ 112 | p 0070 | q 0071 | r 0072 | s 0073 | t 0074 | u 0075 | v 0076 | w 0077 | x 0078 | y 0079 | z 007A | { 007B | | 007C | } 007D | ~ 007E | DEL 007F |
8_ 128 | Ạ 1EA0 | Ắ 1EAE | Ằ 1EB0 | Ặ 1EB6 | Ấ 1EA4 | Ầ 1EA6 | Ẩ 1EA8 | Ậ 1EAC | Ẽ 1EBC | Ẹ 1EB8 | Ế 1EBE | Ề 1EC0 | Ể 1EC2 | Ễ 1EC4 | Ệ 1EC6 | Ố 1ED0 |
9_ 144 | Ồ 1ED2 | Ổ 1ED4 | Ỗ 1ED6 | Ộ 1ED8 | Ợ 1EE2 | Ớ 1EDA | Ờ 1EDC | Ở 1EDE | Ị 1ECA | Ỏ 1ECE | Ọ 1ECC | Ỉ 1EC8 | Ủ 1EE6 | × 0168 | Ụ 1EE4 | Ỳ 1EF2 |
A_ 160 | Õ 00D5 | ắ 1EAF | ằ 1EB1 | Â 1EB7 | ấ 1EA5 | ầ 1EA7 | ẩ 1EA9 | Â 1EAD | ẽ 1EBD | E 1EB9 | E 1EBF | ề 1EC1 | ể 1EC3 | ễ 1EC5 | E 1EC7 | ố 1ED1 |
B_ 176 | ồ 1ED3 | ổ 1ED5 | ỗ 1ED7 | Ỡ 1EE0 | Ơ 01A0 | ộ 1ED9 | ờ 1EDD | ở 1EDF | ị 1ECB | Ự 1EF0 | Ứ 1EE8 | Ừ 1EEA | Ử 1EEC | ơ 01A1 | ớ 1EDB | Ư 01AF |
C_ 192 | À 00C0 | Á 00C1 | Â 00C2 | Ã 00C3 | Ả 1EA2 | Ă 0102 | ẳ 1EB3 | ẵ 1EB5 | È 00C8 | É 00C9 | Ê 00CA | Ẻ 1EBA | Ì 00CC | Í 00CD | Ĩ 0128 | ỳ 1EF3 |
D_ 208 | Đ 0110 | ứ 1EE9 | Ò 00D2 | Ó 00D3 | Ô 00D4 | ạ 1EA1 | ÿ 1EF7 | ừ 1EEB | ử 1EED | Ù 00D9 | Ú 00DA | ỹ 1EF9 | ỵ 1EF5 | Ý 00DD | ỡ 1EE1 | ư 01B0 |
E_ 224 | à 00E0 | á 00E1 | â 00E2 | ã 00E3 | ả 1EA3 | ă 0103 | ữ 1EEF | ẫ 1EAB | è 00E8 | é 00E9 | ê 00EA | ẻ 1EBB | ì 00EC | í 00ED | ĩ 0129 | ỉ 1EC9 |
F_ 240 | đ 0111 | ự 1EF1 | ò 00F2 | ó 00F3 | ô 00F4 | õ 00F5 | ỏ 1ECF | ọ 1ECD | ụ 1EE5 | ù 00F9 | ú 00FA | ũ 0169 | ủ 1EE7 | ý 00FD | ợ 1EE3 | Ữ 1EEE |
Letra Número Puntuación Símbolo Otro Indefinido
Las diferencias con ISO-8859-1 se muestran sombreadas.
Ver también
- ASCII
- Vietnamita citado-legible (VIQR)
- Código estándar vietnamita para el intercambio de información (VSCII)
- Windows-1258
Referencias
- ^ Phung, Quang; Ngo, Hoc D .; Bui, Cuong. "Página de inicio del grupo de trabajo estándar vietnamita" . Grupo Viet-Std . Consultado el 23 de agosto de 2019 .
- ^ a b c d e f Informe de estandarización de codificación de caracteres vietnamita - Especificaciones de codificación de caracteres VISCII y VIQR 1.1 (informe técnico). Grupo Viet-Std. 1992.
- ^ a b "[noticias] TCVN 5712: 1993 (VSCII) - Norma nacional vietnamita" . 1993-06-02. Archivado desde el original el 11 de enero de 2017.
- ^ Lunde, Ken. "Capítulo 1: Descripción general del procesamiento de información CJKV (§ ¿VISCII y VSCII son idénticos? ¿Qué pasa con TCVN?)". Procesamiento de información CJKV (2ª ed.). pag. 17. ISBN 978-0-596-51447-1.
- ^ Grupo de Trabajo de Normalización de Vietnam. "RFC 1456: convenciones para codificar el idioma vietnamita" . IETF .
- ^ "Juegos de caracteres" . IANA .
- ^ Sivonen, Henri (26 de septiembre de 2014). "Los cambios de codificación de caracteres en mc requieren acción cc" . mozilla.dev.apps.thunderbird .
- ^ Sivonen, Henri (26 de septiembre de 2014). "Los cambios de codificación de caracteres en mc requieren acción cc" . mozilla.dev.apps.thunderbird .
VISCII y armscii-8 son especiales en el sentido de que, durante mucho tiempo, el propio Thunderbird (erróneamente) proporcionó estas codificaciones en la interfaz de usuario para la elección de la codificación de caracteres salientes al redactar un mensaje. Por lo tanto, es posible que exista un legado creado por Thunderbird de correos electrónicos VISCII y armscii-8 y publicaciones de Usenet.
- ^ Ngo, Hoc Dinh; Tran, TuBinh. "5. ¿Por qué tener conversión de juego de caracteres vietnamita (juego de caracteres - codificación)?" . Algunas funciones especiales de WinVNKey .
Otras lecturas
- Flohr, Guido (2016) [2006]. "Locale :: RecodeData :: VISCII - Rutinas de conversión para VISCII" . CPAN libintl-perl . Archivado desde el original el 14 de enero de 2017 . Consultado el 14 de enero de 2017 .
- https://www.math.nmsu.edu/~mleisher/Software/csets/VISCII.TXT
enlaces externos
- RFC 1456 - Convenciones para codificar el idioma vietnamita
- Grupo de trabajo de estandarización vietnamita con sede en California
- Informe Viet-Std 1992
- Software AnGiang
- Software y fuentes compatibles con VISCII para MS-DOS y Windows
- Software, bibliotecas y fuentes compatibles con VISCII para Unix
- WinVNKey , controlador de teclado vietnamita para Windows compatible con conjuntos de caracteres multinacionales, incluido VISCII
- MacVNKey , controlador de teclado compatible con VISCII para Macintosh classic