KOI8-U (RFC 2319) es una codificación de caracteres de 8 bits , diseñada para abarcar el ucraniano , que utiliza un alfabeto cirílico . Se basa en KOI8-R , que cubre rusa y búlgara , pero reemplaza ocho caracteres dibujo de la caja con cuatro letras de Ucrania Ç , Å , І y Ї en mayúsculas y minúsculas.
Idioma (s) | Ucraniano , ruso , búlgaro |
---|---|
Clasificación | KOI de 8 bits , ASCII extendido |
Se extiende | KOI8-B |
Residencia en | KOI8-R |
Otras codificaciones relacionadas | KOI8-RU , KOI8-F |
KOI8-RU está estrechamente relacionado, pero agrega Ў para bielorruso . En ambos, las asignaciones de letras coinciden con las de KOI8-E , excepto por Ґ que se agrega a KOI8-F .
En Microsoft Windows , a KOI8-U se le asigna el número de página de códigos 21866. En IBM , a KOI8-U se le asigna la página de códigos / CCSID 1168. [1] [2] [3]
KOI8 sigue siendo de uso mucho más común que ISO 8859-5 , que nunca se puso de moda . Otra codificación de caracteres cirílicos común es Windows-1251 . En el futuro, ambos pueden dar paso a Unicode .
KOI8 significa Kod Obmena Informatsiey, 8 bits (en ruso : Код Обмена Информацией, 8 бит ) que significa "Código para el intercambio de información, 8 bits".
Los juegos de caracteres KOI8 tienen la propiedad de que las letras cirílicas rusas están en orden pseudo-romano en lugar del orden alfabético cirílico natural como en ISO 8859-5. Aunque esto puede parecer poco natural, tiene la útil propiedad de que si se quita el octavo bit, el texto aún se puede leer (o al menos descifrar) en la transliteración de mayúsculas y minúsculas en un terminal ASCII ordinario. Por ejemplo, "Русский Текст" en KOI8-U se convierte en rUSSKIJ tEKST ("Texto en ruso") si se elimina el octavo bit.
Conjunto de caracteres
La siguiente tabla muestra la codificación KOI8-U. [1] [4] Cada carácter se muestra con su punto de código Unicode equivalente .
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 | ||||||||||||||||
1_ 16 | ||||||||||||||||
2_ 32 | SP 0020 | ! 0021 | " 0022 | # 0023 | $ 0024 | % 0025 | & 0026 | « 0027 | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
3_ 48 | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
4_ 64 | @ 0040 | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | Yo 0049 | J 004A | K 004B | L 004C | M 004D | N 004E | O 004F |
5_ 80 | P 0050 | Q 0051 | R 0052 | S 0053 | T 0054 | U 0055 | V 0056 | W 0057 | X 0058 | Y 0059 | Z 005A | [ 005B | \ 005C | ] 005D | ^ 005E | _ 005F |
6_ 96 | ` 0060 | un 0061 | b 0062 | c 0063 | d 0064 | e 0065 | f 0066 | g 0067 | h 0068 | yo 0069 | j 006A | k 006B | l 006C | m 006D | n 006E | o 006F |
7_ 112 | p 0070 | q 0071 | r 0072 | s 0073 | t 0074 | u 0075 | v 0076 | w 0077 | x 0078 | y 0079 | z 007A | { 007B | | 007C | } 007D | ~ 007E | |
8_ 128 | ─ 2500 | │ 2502 | ┌ 250C | ┐ 2510 | └ 2514 | ┘ 2518 | ├ 251C | ┤ 2524 | ┬ 252C | ┴ 2534 | ┼ 253C | ▀ 2580 | ▄ 2584 | █ 2588 | ▌ 258C | ▐ 2590 |
9_ 144 | ° 2591 | ▒ 2592 | ▓ 2593 | ⌠ 2320 | ■ 25A0 | ∙ 2219 | √ 221A | ≈ 2248 | ≤ 2264 | ≥ 2265 | NBSP 00A0 | ⌡ 2321 | ° 00B0 | ² 00B2 | · 00B7 | ÷ 00F7 |
A_ 160 | ═ 2550 | ║ 2551 | ╒ 2552 | ё 0451 | є 0454 | ╔ 2554 | en 0456 | ї 0457 | ╗ 2557 | ╘ 2558 | ╙ 2559 | ╚ 255A | ╛ 255B | ґ 0491 | ╝ 255D | ╞ 255E |
B_ 176 | ╟ 255F | ╠ 2560 | ╡ 2561 | Ё 0401 | Є 0404 | ╣ 2563 | І 0406 | Ї 0407 | ╦ 2566 | ╧ 2567 | ╨ 2568 | ╩ 2569 | ╪ 256A | Ґ 0490 | ╬ 256C | © 00A9 |
C_ 192 | ю 044E | а 0430 | б 0431 | ц 0446 | д 0434 | е 0435 | ф 0444 | г 0433 | х 0445 | и 0438 | © 0439 | к 043A | л 043B | м 043C | н 043D | о 043E |
D_ 208 | п 043F | я 044F | р 0440 | с 0441 | т 0442 | у 0443 | ж 0436 | en 0432 | ь 044C | ы 044B | § 0437 | ø 0448 | э 044D | щ 0449 | ч 0447 | ъ 044A |
E_ 224 | Ю 042E | А 0410 | Б 0411 | Ц 0426 | Д 0414 | Е 0415 | Ф 0424 | Г 0413 | Х 0425 | И 0418 | Й 0419 | К 041A | Л 041B | М 041C | Н 041D | О 041E |
F_ 240 | П 041F | Я 042F | Р 0420 | С 0421 | Т 0422 | У 0423 | Ж 0416 | В 0412 | Ь 042C | Ы 042B | З 0417 | Ш 0428 | Э 042D | Щ 0429 | Ч 0427 | Ъ 042A |
Letra Número Puntuación Símbolo Otro Indefinido Diferencias con KOI8-R (letras no rusas)
Aunque RFC 2319 dice que el carácter 0x95 debe ser U + 2219 (∙), también puede ser U + 2022 (•) para coincidir con el carácter de viñeta en Windows-1251 .
Algunas referencias tienen un error tipográfico y afirman incorrectamente que el carácter 0xB4 es U + 0403, en lugar del U + 0404 correcto. Este error tipográfico está presente en el Apéndice A de RFC 2319 (pero la tabla en el texto principal de RFC proporciona el mapeo correcto).
Ver también
- Codificaciones de caracteres KOI
- Alfabeto ucraniano
Referencias
- ^ a b "Información de la página de códigos SBCS - CPGID: 01168 / Nombre: Ucraniano KOI8-U" . Software de IBM: Globalización: Juegos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . IBM . CH 3-3220-050. Archivado desde el original el 18 de febrero de 2017 . Consultado el 18 de febrero de 2017 . [1] [2]
- ^ "Documento de información CCSID; CCSID 1168; KOI8-U" . IBM . Archivado desde el original el 18 de febrero de 2017 . Consultado el 18 de febrero de 2017 .
- ^ Componentes internacionales para Unicode (ICU), ibm-1168_P100-2002.ucm , 2002-12-03
- ^ Verdy, Philippe; Richter, Helmut (4 de enero de 2016) [13 de octubre de 2008]. "KOI8-U.TXT" . 2.0 . Consultado el 9 de diciembre de 2016 .
Otras lecturas
- Flohr, Guido (2016) [2006]. "Locale :: RecodeData :: KOI8_U - Rutinas de conversión para KOI8-U" . CPAN libintl-perl . 1.1. Archivado desde el original el 15 de enero de 2017 . Consultado el 15 de enero de 2017 .
- RFC 2319
- "KOI8-U (RFC 2319)" . Kermit . Universidad de Columbia . Consultado el 24 de junio de 2020 .
- Leishner, Mark (2008) [20 de diciembre de 1999]. "KOI8-U Bielorruso / Ucraniano cirílico a tabla de mapeo Unicode 2.1 - Basado en RFC 2319" . Departamento de Ciencias Matemáticas, Universidad Estatal de Nuevo México. Archivado desde el original el 19 de febrero de 2017 . Consultado el 19 de febrero de 2017 .
- Kornai, Andras; Birnbaum, David J .; da Cruz, Frank; Davis, Bur; Fowler, George; Paine, Richard B .; Paperno, Slava; Simonsen, Keld J .; Thobe, Glenn E .; Vulis, Dimitri; van Wingen, Johan W. (13 de marzo de 1993). "Preguntas frecuentes sobre la codificación cirílica versión 1.3" . 1.3. Archivado desde el original el 18 de febrero de 2017 . Consultado el 24 de junio de 2020 .
enlaces externos
- Czyborra, Roman (30 de noviembre de 1998) [25 de mayo de 1998]. "La sopa de caracteres cirílicos" . Archivado desde el original el 3 de diciembre de 2016 . Consultado el 3 de diciembre de 2016 .
- Hohlov, Yu. E. "Representación de información cirílica en forma electrónica - Tablas de juego de caracteres (página de códigos)" . Archivado desde el original el 5 de diciembre de 2016 . Consultado el 5 de diciembre de 2016 .
- Nechayev, Valentin (2013) [2001]. "Revisión del universo de codificaciones cirílicas de 8 bits" . Archivado desde el original el 5 de diciembre de 2016 . Consultado el 5 de diciembre de 2016 .
- https://web.archive.org/web/20050206230944/http://www.net.ua/KOI8-U/