KOI8-T es una codificación de caracteres ASCII extendida de un solo byte de 8 bits que adapta KOI8 para cubrir el alfabeto cirílico tayiko . [1] Fue introducido por Michael Davis como una solución provisional para representar el texto cirílico tajiki de una manera intercambiable adecuada para su uso en la web , en un intento de cerrar la brecha entre las codificaciones específicas de fuentes no interoperables existentes y la eventual adopción amplia de Unicode . [2] La biblioteca GNU C lo utiliza como su codificación predeterminada para tayiko. [3]
Idioma (s) | Cirílico tayiko , ruso , búlgaro |
---|---|
Creado por | Michael Davis |
Clasificación | KOI de 8 bits , ASCII extendido |
Se extiende | KOI8-B |
Las letras cirílicas que también se usan en ruso están codificadas de acuerdo con el diseño KOI8-R , lo que hace que la codificación sea un superconjunto KOI8-B , mientras que la puntuación sigue principalmente el diseño en Windows-1251 y Windows-1252, según corresponda. [2]
Conjunto de caracteres
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 | ||||||||||||||||
1_ 16 | ||||||||||||||||
2_ 32 | SP 0020 | ! 0021 | " 0022 | # 0023 | $ 0024 | % 0025 | & 0026 | « 0027 | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
3_ 48 | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
4_ 64 | @ 0040 | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | Yo 0049 | J 004A | K 004B | L 004C | M 004D | N 004E | O 004F |
5_ 80 | P 0050 | Q 0051 | R 0052 | S 0053 | T 0054 | U 0055 | V 0056 | W 0057 | X 0058 | Y 0059 | Z 005A | [ 005B | \ 005C | ] 005D | ^ 005E | _ 005F |
6_ 96 | ` 0060 | un 0061 | b 0062 | c 0063 | d 0064 | e 0065 | f 0066 | g 0067 | h 0068 | yo 0069 | j 006A | k 006B | l 006C | m 006D | n 006E | o 006F |
7_ 112 | p 0070 | q 0071 | r 0072 | s 0073 | t 0074 | u 0075 | v 0076 | w 0077 | x 0078 | y 0079 | z 007A | { 007B | | 007C | } 007D | ~ 007E | |
8_ 128 | қ 049B | ғ 0493 | ‚ 201A | Ғ 0492 | „ 201E | ... 2026 | † 2020 | ‡ 2021 | ‰ 2030 | ҳ 04B3 | ‹ 2039 | Ҳ 04B2 | ҷ 04B7 | Ҷ 04B6 | ||
9_ 144 | Қ 049A | ' 2018 | ' 2019 | “ 201C | " 201D | • 2022 | - 2013 | - 2014 | ™ 2122 | › 203A | ||||||
A_ 160 | ӯ 04EF | Ӯ 04EE | ё 0451 | ¤ 00A4 | ӣ 04E3 | ¦ 00A6 | § 00A7 | « 00AB | ¬ 00AC | SHY 00AD | ® 00AE | |||||
B_ 176 | ° 00B0 | ± 00B1 | ² 00B2 | Ё 0401 | Ӣ 04E2 | ¶ 00B6 | · 00B7 | № 2116 | » 00BB | © 00A9 | ||||||
C_ 192 | ю 044E | а 0430 | б 0431 | ц 0446 | д 0434 | е 0435 | ф 0444 | г 0433 | х 0445 | и 0438 | © 0439 | к 043A | л 043B | м 043C | н 043D | о 043E |
D_ 208 | п 043F | я 044F | р 0440 | с 0441 | т 0442 | у 0443 | ж 0436 | en 0432 | ь 044C | ы 044B | § 0437 | ø 0448 | э 044D | щ 0449 | ч 0447 | ъ 044A |
E_ 224 | Ю 042E | А 0410 | Б 0411 | Ц 0426 | Д 0414 | Е 0415 | Ф 0424 | Г 0413 | Х 0425 | И 0418 | Й 0419 | К 041A | Л 041B | М 041C | Н 041D | О 041E |
F_ 240 | П 041F | Я 042F | Р 0420 | С 0421 | Т 0422 | У 0423 | Ж 0416 | В 0412 | Ь 042C | Ы 042B | З 0417 | Ш 0428 | Э 042D | Щ 0429 | Ч 0427 | Ъ 042A |
Letra Número Puntuación Símbolo Otro Indefinido
Ver también
- Mac OS Turkic Cyrillic , codifica tayiko entre otros idiomas.
Referencias
- ^ a b Flohr, Guido. "Locale :: RecodeData :: KOI8_T - Rutinas de conversión para KOI8-T" . libintl-perl-1.31 . CPAN .
- ^ a b Davis, Michael (21 de noviembre de 2000). "Fuentes Tajiki TrueType para la Web: Preguntas más frecuentes" . Viaje a Tayikistán . Archivado desde el original el 5 de octubre de 2001.
- ^ Storchaka, Serhiy (20 de octubre de 2014). "Agregue soporte de codificación KOI8-T" . Rastreador de errores de Python .