ISO / IEC 8859-11: 2001 , Tecnología de la información - Juegos de caracteres gráficos codificados de un solo byte de 8 bits - Parte 11: Alfabeto latino / tailandés , es parte de la serie ISO / IEC 8859 de codificaciones de caracteres estándar basadas en ASCII , primera edición publicado en 2001. Se le conoce informalmente como latín / tailandés . Es casi idéntico al estándar nacional tailandés TIS-620 (1990). La única diferencia es que ISO / IEC 8859-11 asigna un espacio de no rotura al código 0xA0, mientras que TIS-620 lo deja sin definir. (En la práctica, esta pequeña distinción generalmente se ignora).
ISO-8859-11 no es un nombre principal de juego de caracteres IANA registrado a pesar de seguir el patrón normal para los juegos de caracteres IANA basados en la serie ISO 8859 . Sin embargo, se define como un alias [1] del equivalente cercano TIS-620 (que carece del espacio de no ruptura), y que puede usarse sin problemas para ISO / IEC 8859-11, ya que el espacio de no ruptura tiene un código que no estaba asignado en TIS-620. Microsoft ha asignado la página de códigos 28601, también conocida como Windows-28601, a ISO-8859-11 en Windows. [2] Un borrador tenía las letras tailandesas en diferentes lugares. [3]
Al igual que con todas las variedades de ISO / IEC 8859, los 128 códigos inferiores son equivalentes a ASCII . Los caracteres adicionales, además del espacio sin interrupciones, se encuentran en Unicode en el mismo orden, solo se han cambiado de 0xA1 a U + 0E01 y así sucesivamente.
La página de códigos 874 de Microsoft Windows , así como la página de códigos utilizada en la versión tailandesa de Apple Macintosh , MacThai , son variantes de TIS-620; sin embargo, son incompatibles entre sí.
Conjunto de caracteres
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 | ||||||||||||||||
1_ 16 | ||||||||||||||||
2_ 32 | SP 0020 | ! 0021 | " 0022 | # 0023 | $ 0024 | % 0025 | & 0026 | « 0027 | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
3_ 48 | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
4_ 64 | @ 0040 | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | Yo 0049 | J 004A | K 004B | L 004C | M 004D | N 004E | O 004F |
5_ 80 | P 0050 | Q 0051 | R 0052 | S 0053 | T 0054 | U 0055 | V 0056 | W 0057 | X 0058 | Y 0059 | Z 005A | [ 005B | \ 005C | ] 005D | ^ 005E | _ 005F |
6_ 96 | ` 0060 | un 0061 | b 0062 | c 0063 | d 0064 | e 0065 | f 0066 | g 0067 | h 0068 | yo 0069 | j 006A | k 006B | l 006C | m 006D | n 006E | o 006F |
7_ 112 | p 0070 | q 0071 | r 0072 | s 0073 | t 0074 | u 0075 | v 0076 | w 0077 | x 0078 | y 0079 | z 007A | { 007B | | 007C | } 007D | ~ 007E | |
8_ 128 | ||||||||||||||||
9_ 144 | ||||||||||||||||
A_ 160 | NBSP 00A0 | ก 0E01 | ข 0E02 | ฃ 0E03 | ค 0E04 | ฅ 0E05 | ฆ 0E06 | ง 0E07 | จ 0E08 | ฉ 0E09 | ช 0E0A | ซ 0E0B | ฌ 0E0C | ญ 0E0D | ฎ 0E0E | ฏ 0E0F |
B_ 176 | ฐ 0E10 | ฑ 0E11 | ฒ 0E12 | ณ 0E13 | ด 0E14 | ต 0E15 | ถ 0E16 | ท 0E17 | ธ 0E18 | น 0E19 | บ 0E1A | ป 0E1B | ผ 0E1C | ฝ 0E1D | พ 0E1E | ฟ 0E1F |
C_ 192 | ภ 0E20 | ม 0E21 | ย 0E22 | ร 0E23 | ฤ 0E24 | ล 0E25 | ฦ 0E26 | ว 0E27 | ศ 0E28 | ษ 0E29 | ส 0E2A | ห 0E2B | ฬ 0E2C | อ 0E2D | ฮ 0E2E | ฯ 0E2F |
D_ 208 | ะ 0E30 | ◌ ั 0E31 | า 0E32 | ำ 0E33 | ◌ ิ 0E34 | ◌ ี 0E35 | ◌ ึ 0E36 | ◌ ื 0E37 | ◌ ุ 0E38 | ◌ ู 0E39 | ◌ ฺ 0E3A | ฿ 0E3F | ||||
E_ 224 | เ 0E40 | แ 0E41 | โ 0E42 | ใ 0E43 | ไ 0E44 | ๅ 0E45 | ๆ 0E46 | ◌ ็ 0E47 | ◌ ่ 0E48 | ◌ ้ 0E49 | ◌ ๊ 0E4A | ◌ ๋ 0E4B | ◌ ์ 0E4C | ◌ ํ 0E4D | ◌ ๎ 0E4E | ๏ 0E4F |
F_ 240 | ๐ 0E50 | ๑ 0E51 | ๒ 0E52 | ๓ 0E53 | ๔ 0E54 | ๕ 0E55 | ๖ 0E56 | ๗ 0E57 | ๘ 0E58 | ๙ 0E59 | ๚ 0E5A | ๛ 0E5B |
Letra Número Puntuación Símbolo Otro Indefinido
Los valores de código D1, D4-DA, E7-EE son para combinar caracteres .
Extensiones de proveedores
Página de códigos 874 (IBM) / 9066
La página de códigos 874 de IBM ( CP874 , IBM-874 , x-IBM874 ), también conocida como página de códigos 9066 ( IBM-9066 ), [5] difiere de ISO / IEC 8859-11 en solo nueve símbolos que se muestran en el recuadro de la siguiente tabla: [6] [7] [8]
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A_ 160 | ◌ ่ 0E48 | ก 0E01 | ข 0E02 | ฃ 0E03 | ค 0E04 | ฅ 0E05 | ฆ 0E06 | ง 0E07 | จ 0E08 | ฉ 0E09 | ช 0E0A | ซ 0E0B | ฌ 0E0C | ญ 0E0D | ฎ 0E0E | ฏ 0E0F |
B_ 176 | ฐ 0E10 | ฑ 0E11 | ฒ 0E12 | ณ 0E13 | ด 0E14 | ต 0E15 | ถ 0E16 | ท 0E17 | ธ 0E18 | น 0E19 | บ 0E1A | ป 0E1B | ผ 0E1C | ฝ 0E1D | พ 0E1E | ฟ 0E1F |
C_ 192 | ภ 0E20 | ม 0E21 | ย 0E22 | ร 0E23 | ฤ 0E24 | ล 0E25 | ฦ 0E26 | ว 0E27 | ศ 0E28 | ษ 0E29 | ส 0E2A | ห 0E2B | ฬ 0E2C | อ 0E2D | ฮ 0E2E | ฯ 0E2F |
D_ 208 | ะ 0E30 | ◌ ั 0E31 | า 0E32 | ำ 0E33 | ◌ ิ 0E34 | ◌ ี 0E35 | ◌ ึ 0E36 | ◌ ื 0E37 | ◌ ุ 0E38 | ◌ ู 0E39 | ◌ ฺ 0E3A | ◌ ้ ︀ 0E49 | ◌ ๊ ︀ 0E4A | ◌ ๋ ︀ 0E4B | ◌ ์ ︀ 0E4C | ฿ 0E3F |
E_ 224 | เ 0E40 | แ 0E41 | โ 0E42 | ใ 0E43 | ไ 0E44 | ๅ 0E45 | ๆ 0E46 | ◌ ็ 0E47 | ◌ ่ 0E48 | ◌ ้ 0E49 | ◌ ๊ 0E4A | ◌ ๋ 0E4B | ◌ ์ 0E4C | ◌ ํ 0E4D | ◌ ๎ 0E4E | ๏ 0E4F |
F_ 240 | ๐ 0E50 | ๑ 0E51 | ๒ 0E52 | ๓ 0E53 | ๔ 0E54 | ๕ 0E55 | ๖ 0E56 | ๗ 0E57 | ๘ 0E58 | ๙ 0E59 | ๚ 0E5A | ๛ 0E5B | ¢ 00A2 | ¬ 00AC | ¦ 00A6 | NBSP 00A0 |
Página de códigos 1161
La página de códigos 1161 ( CP1161 , IBM-1161 ), es una variante de la página de códigos 874 de IBM. La única diferencia es el símbolo del euro (€) en la posición DE hex (222). [11] [12]
Página de códigos 874 (Microsoft) / 1162
La página de códigos de Windows 874 ( windows-874 , MS874 , x-windows-874 ), conocida como página de códigos 1162 ( CP1162 , IBM-1162 ) por IBM, [13] [14] es utilizada por Microsoft Windows. Se diferencia de ISO / IEC 8859-11 por solo nueve símbolos, como se muestra en la siguiente tabla:
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8_ 128 | 20 € AC | ... 2026 | ||||||||||||||
9_ 144 | ' 2018 | ' 2019 | “ 201C | " 201D | • 2022 | - 2013 | - 2014 |
Mac OS tailandés
Esta es la variante utilizada en el Mac OS clásico .
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8_ 128 [a] | « 00AB | » 00BB | ... 2026 | ◌ ่ 0E48 | ◌ ้ 0E49 | ◌ ๊ 0E4A | ◌ ๋ 0E4B | ◌ ์ 0E4C | ◌ ่ 0E48 | ◌ ้ 0E49 | ◌ ๊ 0E4A | ◌ ๋ 0E4B | ◌ ์ 0E4C | “ 201C | " 201D | ◌ ํ 0E4D |
9_ 144 [b] | • 2022 | ◌ ั 0E31 | ◌ ็ 0E47 | ◌ ิ 0E34 | ◌ ี 0E35 | ◌ ึ 0E36 | ◌ ื 0E37 | ◌ ่ 0E48 | ◌ ้ 0E49 | ◌ ๊ 0E4A | ◌ ๋ 0E4B | ◌ ์ 0E4C | ' 2018 | ' 2019 | ||
A_ 160 | NBSP 00A0 | ก 0E01 | ข 0E02 | ฃ 0E03 | ค 0E04 | ฅ 0E05 | ฆ 0E06 | ง 0E07 | จ 0E08 | ฉ 0E09 | ช 0E0A | ซ 0E0B | ฌ 0E0C | ญ 0E0D | ฎ 0E0E | ฏ 0E0F |
B_ 176 | ฐ 0E10 | ฑ 0E11 | ฒ 0E12 | ณ 0E13 | ด 0E14 | ต 0E15 | ถ 0E16 | ท 0E17 | ธ 0E18 | น 0E19 | บ 0E1A | ป 0E1B | ผ 0E1C | ฝ 0E1D | พ 0E1E | ฟ 0E1F |
C_ 192 | ภ 0E20 | ม 0E21 | ย 0E22 | ร 0E23 | ฤ 0E24 | ล 0E25 | ฦ 0E26 | ว 0E27 | ศ 0E28 | ษ 0E29 | ส 0E2A | ห 0E2B | ฬ 0E2C | อ 0E2D | ฮ 0E2E | ฯ 0E2F |
D_ 208 | ะ 0E30 | ◌ ั 0E31 | า 0E32 | ำ 0E33 | ◌ ิ 0E34 | ◌ ี 0E35 | ◌ ึ 0E36 | ◌ ื 0E37 | ◌ ุ 0E38 | ◌ ู 0E39 | ◌ ฺ 0E3A | WJ 2060 | ZWSP 200B | - 2013 | - 2014 | ฿ 0E3F |
E_ 224 | เ 0E40 | แ 0E41 | โ 0E42 | ใ 0E43 | ไ 0E44 | ๅ 0E45 | ๆ 0E46 | ◌ ็ 0E47 | ◌ ่ 0E48 | ◌ ้ 0E49 | ◌ ๊ 0E4A | ◌ ๋ 0E4B | ◌ ์ 0E4C | ◌ ํ 0E4D | ™ 2122 | ๏ 0E4F |
F_ 240 | ๐ 0E50 | ๑ 0E51 | ๒ 0E52 | ๓ 0E53 | ๔ 0E54 | ๕ 0E55 | ๖ 0E56 | ๗ 0E57 | ๘ 0E58 | ๙ 0E59 | ® 00AE | © 00A9 |
Ver también
- LMBCS-11
Notas al pie
- ^ Las marcas diacríticas duplicadas en esta línea están diseñadas para mostrarse en una "posición baja izquierda" (0x83-87), "posición baja" (0x88-8C) o "posición izquierda" (0x8F), y se siguen en Apple mapeo de ida y vuelta mediante uncarácter de Área de uso privado adjuntoU + F875, U + F873 o U + F874 respectivamente.
- ^ Las marcas diacríticas duplicadas en esta línea están destinadas a mostrarse en una "posición izquierda", y van seguidas de uncarácter U + F874 de Área de uso privado adjuntoen el mapeo de ida y vuelta de Apple.
Referencias
- ^ "Juegos de caracteres de IANA" .
- ^ "js-codepage, Obtención de páginas de códigos" .
- ^ Everson, Michael. "Propuesta de ISO 8859-11" .
- ^ Whistler, Ken (2002-10-07), ISO / IEC 8859-11: 2001 para Unicode , Unicode Consortium
- ^ IBM ; Consorcio Unicode . "convrtrs.txt" . Componentes internacionales para Unicode . v. 59180.0.1.
Sí ibm-874 == ibm-9066. ibm-1161 tiene la actualización del euro.
- ^ "Documento de información de la página de códigos 874" . Archivado desde el original el 16 de enero de 2017.
- ^ "Documento de información CCSID 874" . Archivado desde el original el 27 de marzo de 2016.
- ^ "Documento de información CCSID 9066" . Archivado desde el original el 27 de marzo de 2016.
- ^ IBM . "Página de códigos CPGID 00874" (PDF) . REGISTRO: Juegos de caracteres gráficos y páginas de códigos .
- ^ Página de códigos CPGID 00874 (txt) , IBM
- ^ "Página de códigos 01161" (PDF) .
- ^ "Documento de información CCSID 1161" . Archivado desde el original el 27 de marzo de 2016.
- ^ "Documento de información de la página de códigos 1162" . Archivado desde el original el 17 de marzo de 2016.
- ^ "Documento de información CCSID 1162" . Archivado desde el original el 27 de marzo de 2016.
- ^ "Página de códigos 01162" (PDF) .
- ^ Steele, Shawn (28 de febrero de 1998). "cp874 a tabla Unicode" . Consorcio Unicode , Microsoft .
- ^ Página de códigos CPGID 01162 (txt) , IBM
- ^ Componentes internacionales para Unicode (ICU), ibm-1162_P100-1999.ucm , 2002-12-03
- ^ Apple (5 de abril de 2005). "Mapa (versión externa) del juego de caracteres tailandés de Mac OS a Unicode 3.2 y posterior" . Consorcio Unicode .
enlaces externos
- ISO / IEC 8859-11: 2001
- ISO / IEC 8859-11: 1999 - Juegos de caracteres gráficos codificados de un solo byte de 8 bits, Parte 11: Juego de caracteres latinos / tailandeses (borrador con fecha del 22 de junio de 1999; reemplazado por ISO / IEC 8859-11: 2001, publicado el 15 de diciembre , 2001)
- Página de códigos de Windows 874
- Conjunto de caracteres tailandeses ISO-IR 166 (13 de julio de 1992, de la norma tailandesa TIS 620-2533 (1990))
- Estandarización e implementación del idioma tailandés PDF 175k