KOI8-RU es una codificación de caracteres de 8 bits , diseñada para abarcar ruso , ucraniano y bielorruso que utilizan un alfabeto cirílico . Está estrechamente relacionado con KOI8-R , que cubre rusa y búlgara , pero reemplaza el dibujo de la caja caracteres diez con cinco cartas de Ucrania y de Bielorrusia Ç , Å , І , Ї , y ÷ en mayúsculas y minúsculas. Está aún más relacionado con KOI8-U, que no incluye Ў pero por lo demás hace los mismos reemplazos. Las asignaciones de letras adicionales son igualadas por KOI8-E , excepto por is que se agrega a KOI8-F .
Idioma (s) | Bielorruso , ucraniano , ruso , búlgaro |
---|---|
Clasificación | KOI de 8 bits , ASCII extendido |
Se extiende | KOI8-B |
Residencia en | KOI8-U , KOI8-R |
Otras codificaciones relacionadas | KOI8-E , KOI8-F |
En IBM , a KOI8-RU se le asigna la página de códigos / CCSID 1167. [1] [2]
KOI8 sigue siendo de uso mucho más común que ISO 8859-5 , que nunca se puso de moda . Otra codificación de caracteres cirílicos común es Windows-1251 . En el futuro, ambos pueden dar paso a Unicode .
KOI8 significa Kod Obmena Informatsiey, 8 bits (en ruso : Код Обмена Информацией, 8 бит ) que significa "Código para el intercambio de información, 8 bits".
Los juegos de caracteres KOI8 tienen la propiedad de que las letras cirílicas rusas están en orden pseudo-romano en lugar del orden alfabético cirílico natural como en ISO 8859-5. Aunque esto puede parecer poco natural, tiene la útil propiedad de que si se quita el octavo bit, el texto aún se puede leer (o al menos descifrar) en la transliteración de mayúsculas y minúsculas en un terminal ASCII ordinario. Por ejemplo, "Русский Текст" en KOI8-RU se convierte en rUSSKIJ tEKST ("Texto en ruso") si se elimina el octavo bit.
Conjunto de caracteres
La siguiente tabla muestra la codificación KOI8-RU. Cada carácter se muestra con su punto de código Unicode equivalente .
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 | ||||||||||||||||
1_ 16 | ||||||||||||||||
2_ 32 | SP 0020 | ! 0021 | " 0022 | # 0023 | $ 0024 | % 0025 | & 0026 | « 0027 | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
3_ 48 | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
4_ 64 | @ 0040 | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | Yo 0049 | J 004A | K 004B | L 004C | M 004D | N 004E | O 004F |
5_ 80 | P 0050 | Q 0051 | R 0052 | S 0053 | T 0054 | U 0055 | V 0056 | W 0057 | X 0058 | Y 0059 | Z 005A | [ 005B | \ 005C | ] 005D | ^ 005E | _ 005F |
6_ 96 | ` 0060 | un 0061 | b 0062 | c 0063 | d 0064 | e 0065 | f 0066 | g 0067 | h 0068 | yo 0069 | j 006A | k 006B | l 006C | m 006D | n 006E | o 006F |
7_ 112 | p 0070 | q 0071 | r 0072 | s 0073 | t 0074 | u 0075 | v 0076 | w 0077 | x 0078 | y 0079 | z 007A | { 007B | | 007C | } 007D | ~ 007E | |
8_ 128 | ─ 2500 | │ 2502 | ┌ 250C | ┐ 2510 | └ 2514 | ┘ 2518 | ├ 251C | ┤ 2524 | ┬ 252C | ┴ 2534 | ┼ 253C | ▀ 2580 | ▄ 2584 | █ 2588 | ▌ 258C | ▐ 2590 |
9_ 144 | ° 2591 | ▒ 2592 | ▓ 2593 | “ 201C | ■ 25A0 | ∙ 2219 | " 201D | - 2014 | № 2116 | ™ 2122 | NBSP 00A0 | » 00BB | ® 00AE | « 00AB | · 00B7 | ¤ 00A4 |
A_ 160 | ═ 2550 | ║ 2551 | ╒ 2552 | ё 0451 | є 0454 | ╔ 2554 | en 0456 | ї 0457 | ╗ 2557 | ╘ 2558 | ╙ 2559 | ╚ 255A | ╛ 255B | ґ 0491 | ў 045E | ╞ 255E |
B_ 176 | ╟ 255F | ╠ 2560 | ╡ 2561 | Ё 0401 | Є 0404 | ╣ 2563 | І 0406 | Ї 0407 | ╦ 2566 | ╧ 2567 | ╨ 2568 | ╩ 2569 | ╪ 256A | Ґ 0490 | Ў 040E | © 00A9 |
C_ 192 | ю 044E | а 0430 | б 0431 | ц 0446 | д 0434 | е 0435 | ф 0444 | г 0433 | х 0445 | и 0438 | © 0439 | к 043A | л 043B | м 043C | н 043D | о 043E |
D_ 208 | п 043F | я 044F | р 0440 | с 0441 | т 0442 | у 0443 | ж 0436 | en 0432 | ь 044C | ы 044B | § 0437 | ø 0448 | э 044D | щ 0449 | ч 0447 | ъ 044A |
E_ 224 | Ю 042E | А 0410 | Б 0411 | Ц 0426 | Д 0414 | Е 0415 | Ф 0424 | Г 0413 | Х 0425 | И 0418 | Й 0419 | К 041A | Л 041B | М 041C | Н 041D | О 041E |
F_ 240 | П 041F | Я 042F | Р 0420 | С 0421 | Т 0422 | У 0423 | Ж 0416 | В 0412 | Ь 042C | Ы 042B | З 0417 | Ш 0428 | Э 042D | Щ 0429 | Ч 0427 | Ъ 042A |
Letra Número Puntuación Símbolo Otro Indefinido Diferencias con KOI8-R
Aunque RFC 2319 dice que el carácter 0x95 debe ser U + 2219 (∙), también puede ser U + 2022 (•) para coincidir con el carácter de viñeta en Windows-1251 .
Algunas referencias tienen un error tipográfico y afirman incorrectamente que el carácter 0xB4 es U + 0403, en lugar del U + 0404 correcto. Este error tipográfico está presente en el Apéndice A de RFC 2319 (pero la tabla en el texto principal de RFC proporciona el mapeo correcto).
Ver también
- Codificaciones de caracteres KOI
Referencias
- ^ "Documento de información de la página de códigos 1167" . Archivado desde el original el 16 de enero de 2017.
- ^ "Documento de información CCSID 1167" . Archivado desde el original el 27 de marzo de 2016.
- ^ Leisher, Mark (1999-12-20), KOI8-RU Tabla de mapeo de cirílico bielorruso / ucraniano a Unicode 2.1 , KOI8RU.TXT
- ^ Página de códigos CPGID 01167 (pdf) (PDF) , IBM
- ^ Página de códigos CPGID 01167 (txt) , IBM
enlaces externos
- Nechayev, Valentin (2013) [2001]. "Revisión del universo de codificaciones cirílicas de 8 bits" . Archivado desde el original el 5 de diciembre de 2016 . Consultado el 5 de diciembre de 2016 .