KOI8-R (RFC 1489) es una codificación de caracteres de 8 bits , derivada de la codificación KOI-8 del programador Andrei Chernov en 1993 y diseñada para abarcar el ruso , que utiliza un alfabeto cirílico . KOI8-R se basó en el código Morse ruso , que se creó a partir de una versión fonética del código Morse latino . Como resultado, las letras cirílicas rusas están en orden pseudo-romano en lugar del orden alfabético cirílico normal. Aunque esto puede parecer poco natural, si se quita el octavo bit, el texto es parcialmente legible en ASCII y puede convertirse a KOI7 sintácticamente correcto .. Por ejemplo, "Русский Текст" en KOI8-R se convierte en rUSSKIJ tEKST ("Texto en ruso").
Idioma (s) | Ruso , búlgaro |
---|---|
Clasificación | KOI de 8 bits , ASCII extendido |
Se extiende | KOI8-B |
Residencia en | KOI-8 |
Otras codificaciones relacionadas | KOI8-U , KOI8-RU |
KOI8 significa Kod Obmena Informatsiey, 8 bits (en ruso : Код Обмена Информацией, 8 бит ) que significa "Código para el intercambio de información, 8 bits". En Microsoft Windows , a KOI8-R se le asigna el número de página de códigos 20866. En IBM , a KOI8-R se le asigna la página de códigos 878. [1] [2] KOI8-R también cubre el búlgaro , pero no se ha utilizado para ese propósito desde que se aceptó CP1251 . El uso de estas páginas de códigos más antiguas está siendo reemplazado por Unicode como una forma más común de representar cirílico junto con otros lenguajes.
Conjunto de caracteres
La siguiente tabla muestra la codificación KOI8-R. Cada carácter se muestra con su punto de código Unicode equivalente .
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 | ||||||||||||||||
1_ 16 | ||||||||||||||||
2_ 32 | SP 0020 | ! 0021 | " 0022 | # 0023 | $ 0024 | % 0025 | & 0026 | « 0027 | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
3_ 48 | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
4_ 64 | @ 0040 | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | Yo 0049 | J 004A | K 004B | L 004C | M 004D | N 004E | O 004F |
5_ 80 | P 0050 | Q 0051 | R 0052 | S 0053 | T 0054 | U 0055 | V 0056 | W 0057 | X 0058 | Y 0059 | Z 005A | [ 005B | \ 005C | ] 005D | ^ 005E | _ 005F |
6_ 96 | ` 0060 | un 0061 | b 0062 | c 0063 | d 0064 | e 0065 | f 0066 | g 0067 | h 0068 | yo 0069 | j 006A | k 006B | l 006C | m 006D | n 006E | o 006F |
7_ 112 | p 0070 | q 0071 | r 0072 | s 0073 | t 0074 | u 0075 | v 0076 | w 0077 | x 0078 | y 0079 | z 007A | { 007B | | 007C | } 007D | ~ 007E | |
8_ 128 | ─ 2500 | │ 2502 | ┌ 250C | ┐ 2510 | └ 2514 | ┘ 2518 | ├ 251C | ┤ 2524 | ┬ 252C | ┴ 2534 | ┼ 253C | ▀ 2580 | ▄ 2584 | █ 2588 | ▌ 258C | ▐ 2590 |
9_ 144 | ° 2591 | ▒ 2592 | ▓ 2593 | ⌠ 2320 | ■ 25A0 | ∙ 2219 | √ 221A | ≈ 2248 | ≤ 2264 | ≥ 2265 | NBSP 00A0 | ⌡ 2321 | ° 00B0 | ² 00B2 | · 00B7 | ÷ 00F7 |
A_ 160 | ═ 2550 | ║ 2551 | ╒ 2552 | ё 0451 | ╓ 2553 | ╔ 2554 | ╕ 2555 | ╖ 2556 | ╗ 2557 | ╘ 2558 | ╙ 2559 | ╚ 255A | ╛ 255B | ╜ 255C | ╝ 255D | ╞ 255E |
B_ 176 | ╟ 255F | ╠ 2560 | ╡ 2561 | Ё 0401 | ╢ 2562 | ╣ 2563 | ╤ 2564 | ╥ 2565 | ╦ 2566 | ╧ 2567 | ╨ 2568 | ╩ 2569 | ╪ 256A | ╫ 256B | ╬ 256C | © 00A9 |
C_ 192 | ю 044E | а 0430 | б 0431 | ц 0446 | д 0434 | е 0435 | ф 0444 | г 0433 | х 0445 | и 0438 | © 0439 | к 043A | л 043B | м 043C | н 043D | о 043E |
D_ 208 | п 043F | я 044F | р 0440 | с 0441 | т 0442 | у 0443 | ж 0436 | en 0432 | ь 044C | ы 044B | § 0437 | ø 0448 | э 044D | щ 0449 | ч 0447 | ъ 044A |
E_ 224 | Ю 042E | А 0410 | Б 0411 | Ц 0426 | Д 0414 | Е 0415 | Ф 0424 | Г 0413 | Х 0425 | И 0418 | Й 0419 | К 041A | Л 041B | М 041C | Н 041D | О 041E |
F_ 240 | П 041F | Я 042F | Р 0420 | С 0421 | Т 0422 | У 0423 | Ж 0416 | В 0412 | Ь 042C | Ы 042B | З 0417 | Ш 0428 | Э 042D | Щ 0429 | Ч 0427 | Ъ 042A |
Letra Número Puntuación Símbolo Otro Indefinido
Ver también
- KOI8-B , una derivación de KOI8-R con solo el subconjunto de letras implementado.
- KOI8-U , otra codificación derivada que agrega caracteres ucranianos .
- Codificaciones de caracteres KOI
- RELCOM
- Windows-1251 , otra codificación de caracteres cirílica común.
Referencias
- ^ "Información de la página de códigos SBCS - CPGID: 00878 / Nombre: koi8-r de Internet ruso" . Software de IBM: Globalización: Juegos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . IBM . CH 3-3220-050. Archivado desde el original el 18 de febrero de 2017 . Consultado el 18 de febrero de 2017 .
- ^ "Documento de información del CCSID; CCSID 878; KOI8-R CYRILLIC" . IBM . Consultado el 18 de febrero de 2017 .
- ^ Richter, Helmut (4 de enero de 2016) [18 de agosto de 1999]. "KOI8-R.TXT" . 2.0 . Consultado el 9 de diciembre de 2016 .
- ^ Página de códigos CPGID 00878 (pdf) (PDF) , IBM
- ^ Página de códigos CPGID 00878 (txt) , IBM
- ^ Componentes internacionales para Unicode (ICU), ibm-878_P100-1996.ucm , 2002-12-03
Otras lecturas
- Flohr, Guido; Beso, Gabor; Chernov, Andrey A. (2016) [2006]. "Locale :: RecodeData :: KOI8_R - Rutinas de conversión para KOI8-R" . CPAN libintl-perl . 1.0. Archivado desde el original el 15 de enero de 2017 . Consultado el 15 de enero de 2017 .
- Kostis, Kosta. "koi8-r (codificación rusa U * IX, también utilizada por RELCOM)" . 1.20. Archivado desde el original el 16 de enero de 2017 . Consultado el 16 de enero de 2017 .
- RFC 1489
- "KOI8-R (RFC 1489)" . Kermit . Universidad de Columbia . Consultado el 24 de junio de 2020 .
- Kornai, Andras; Birnbaum, David J .; da Cruz, Frank; Davis, Bur; Fowler, George; Paine, Richard B .; Paperno, Slava; Simonsen, Keld J .; Thobe, Glenn E .; Vulis, Dimitri; van Wingen, Johan W. (13 de marzo de 1993). "Preguntas frecuentes sobre la codificación cirílica versión 1.3" . 1.3 . Consultado el 24 de junio de 2020 .
enlaces externos
- Decodificador cirílico universal , un programa en línea que puede ayudar a recuperar textos cirílicos con KOI8-R roto u otras codificaciones de caracteres .
- "El hogar del KOI8-R desde 1995" . Consultado el 5 de diciembre de 2016 .
- Czyborra, Roman (30 de noviembre de 1998) [25 de mayo de 1998]. "La sopa cirílico de caracteres" . Archivado desde el original el 3 de diciembre de 2016 . Consultado el 3 de diciembre de 2016 .
- Hohlov, Yu. E. "Representación de información cirílica en forma electrónica - Tablas de juego de caracteres (página de códigos)" . Archivado desde el original el 5 de diciembre de 2016 . Consultado el 5 de diciembre de 2016 .
- Nechayev, Valentin (2013) [2001]. "Revisión del universo de codificaciones cirílicas de 8 bits" . Archivado desde el original el 5 de diciembre de 2016 . Consultado el 5 de diciembre de 2016 .