ISO-IR-111 [1] o KOI8-E [2] es un conjunto de caracteres de 8 bits. Es una extensión multinacional de KOI-8 para bielorruso , macedonio , serbio y ucraniano (excepto Ґ ґ que se agrega a KOI8-F ). El nombre "ISO-IR-111" se refiere a su número de registro en el registro ISO-IR y lo denota como un conjunto utilizable con ISO / IEC 2022 .
Alias | ISO-IR-111 |
---|---|
Idioma (s) | Ruso , bielorruso , macedonio , serbio , ucraniano (parcial) |
Estándar | ECMA-113: 1986 |
Clasificación | ASCII extendido , KOI |
Se extiende | KOI8-B |
Sucesor | ECMA-113: 1988 ( ISO-8859-5 ) |
Otras codificaciones relacionadas | KOI8-F |
Fue definido por la primera edición (1986) de ECMA-113, [3] que es el estándar Ecma International correspondiente a ISO / IEC 8859-5 , y como tal también corresponde a una versión preliminar de 1987 de ISO-8859-5. [4] Las ediciones publicadas de ISO / IEC 8859-5 corresponden en cambio a ediciones posteriores de ECMA-113, que define una codificación diferente. [5]
Nombrar confusión
ISO-IR-111, la edición de 1985 de ECMA-113 (también llamada "ECMA-Cyrillic" o "KOI8-E"), se basó en la edición de 1974 de GOST 19768 (es decir, KOI-8 ). En 1987 ECMA-113 fue rediseñado. [5] Estas ediciones más recientes de ECMA-113 son equivalentes a ISO-8859-5 , [5] [6] y no siguen el diseño KOI. Esta confusión ha llevado a un error común de que ISO-8859-5 se definió en o se basó en GOST 19768-74. [6]
Posiblemente como otra consecuencia de esto, RFC 1345 enumera erróneamente una página de códigos diferente con los nombres "ISO-IR-111" y "ECMA-Cyrillic", que se asemeja a ISO-8859-5 con filas reordenadas y es parcialmente compatible con Windows-1251. . [7] [6] Debido a las preocupaciones de que las implementaciones existentes podrían usar la definición RFC 1345 para esas dos etiquetas, se propuso que la IANA reconozca además KOI8-E
como una etiqueta para el contenido de ECMA-113: 1985, [7] y la IANA actualmente enumera esa etiqueta como un alias. [2]
Conjunto de caracteres
La siguiente tabla muestra la codificación ISO-IR-111. Cada carácter se muestra con su punto de código Unicode equivalente .
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 | ||||||||||||||||
1_ 16 | ||||||||||||||||
2_ 32 | SP 0020 | ! 0021 | " 0022 | # 0023 | $ 0024 | % 0025 | & 0026 | « 0027 | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
3_ 48 | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
4_ 64 | @ 0040 | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | Yo 0049 | J 004A | K 004B | L 004C | M 004D | N 004E | O 004F |
5_ 80 | P 0050 | Q 0051 | R 0052 | S 0053 | T 0054 | U 0055 | V 0056 | W 0057 | X 0058 | Y 0059 | Z 005A | [ 005B | \ 005C | ] 005D | ^ 005E | _ 005F |
6_ 96 | ` 0060 | un 0061 | b 0062 | c 0063 | d 0064 | e 0065 | f 0066 | g 0067 | h 0068 | yo 0069 | j 006A | k 006B | l 006C | m 006D | n 006E | o 006F |
7_ 112 | p 0070 | q 0071 | r 0072 | s 0073 | t 0074 | u 0075 | v 0076 | w 0077 | x 0078 | y 0079 | z 007A | { 007B | | 007C | } 007D | ~ 007E | |
8_ 128 | ||||||||||||||||
9_ 144 | ||||||||||||||||
A_ 160 | NBSP 00A0 | ђ 0452 | ѓ 0453 | ё 0451 | є 0454 | es 0455 | en 0456 | ї 0457 | ј 0458 | љ 0459 | њ 045A | ћ 045B | ќ 045C | SHY 00AD | ў 045E | џ 045F |
B_ 176 | № 2116 | Ђ 0402 | Ѓ 0403 | Ё 0401 | Є 0404 | Ѕ 0405 | І 0406 | Ї 0407 | Ј 0408 | Љ 0409 | Њ 040A | Ћ 040B | Ќ 040C | ¤ 00A4 | Ў 040E | Џ 040F |
C_ 192 | ю 044E | а 0430 | б 0431 | ц 0446 | д 0434 | е 0435 | ф 0444 | г 0433 | х 0445 | и 0438 | © 0439 | к 043A | л 043B | м 043C | н 043D | о 043E |
D_ 208 | п 043F | я 044F | р 0440 | с 0441 | т 0442 | у 0443 | ж 0436 | en 0432 | ь 044C | ы 044B | § 0437 | ø 0448 | э 044D | щ 0449 | ч 0447 | ъ 044A |
E_ 224 | Ю 042E | А 0410 | Б 0411 | Ц 0426 | Д 0414 | Е 0415 | Ф 0424 | Г 0413 | Х 0425 | И 0418 | Й 0419 | К 041A | Л 041B | М 041C | Н 041D | О 041E |
F_ 240 | П 041F | Я 042F | Р 0420 | С 0421 | Т 0422 | У 0423 | Ж 0416 | В 0412 | Ь 042C | Ы 042B | З 0417 | Ш 0428 | Э 042D | Щ 0429 | Ч 0427 | Ъ 042A |
Letra Número Puntuación Símbolo Otro Indefinido
Versiones ampliadas y modificadas
Se utilizó una versión modificada llamada KOI8 Unified o KOI8-F en el software producido por Fingertip Software, agregando el Ґ en su ubicación KOI8-U (reemplazando el guión suave y desplazando el signo de moneda universal ), y agregando algunos caracteres gráficos en el control C1 área de códigos , principalmente de KOI8-R y Windows-1251 . [4] [6] [8] [9]
Página de códigos RFC 1345 incorrecta
Idioma (s) | Ruso , bielorruso , macedonio , serbio |
---|---|
Estándar | RFC 1345 |
Clasificación | ASCII extendido |
Transforma / Codifica | ISO-IR-111 |
Otras codificaciones relacionadas | ISO-8859-5 , Windows-1251 |
RFC 1345 enumera erróneamente una página de códigos diferente con el nombre ISO-IR-111, que codifica los mismos caracteres cirílicos pero con un diseño diferente. Se parece a una mezcla de Windows-1251 e ISO-8859-5 . [7] Específicamente, la línea A_ corresponde a ISO-8859-5, las líneas C_ a F_ corresponden a Windows-1251 [6] (equivalente a las líneas B_ a E_ de ISO-8859-5), y la línea B_ casi corresponde a la línea F_ de ISO-8859-5, con la excepción de que § se sustituye por un ¤ .
Ciertos códigos se asemejan a ISO-IR-111 con mayúsculas y minúsculas, lo que puede haber contribuido a la confusión. La mayoría difieren y se muestran a continuación con un borde grueso.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8_ 128 | ||||||||||||||||
9_ 144 | ||||||||||||||||
A_ 160 | NBSP 00A0 | Ё 0401 | Ђ 0402 | Ѓ 0403 | Є 0404 | Ѕ 0405 | І 0406 | Ї 0407 | Ј 0408 | Љ 0409 | Њ 040A | Ћ 040B | Ќ 040C | SHY 00AD | Ў 040E | Џ 040F |
B_ 176 | № 2116 | ё 0451 | ђ 0452 | ѓ 0453 | є 0454 | es 0455 | en 0456 | ї 0457 | ј 0458 | љ 0459 | њ 045A | ћ 045B | ќ 045C | ¤ 00A4 | ў 045E | џ 045F |
C_ 192 | А 0410 | Б 0411 | В 0412 | Г 0413 | Д 0414 | Е 0415 | Ж 0416 | З 0417 | И 0418 | Й 0419 | К 041A | Л 041B | М 041C | Н 041D | О 041E | П 041F |
D_ 208 | Р 0420 | С 0421 | Т 0422 | У 0423 | Ф 0424 | Х 0425 | Ц 0426 | Ч 0427 | Ш 0428 | Щ 0429 | Ъ 042A | Ы 042B | Ь 042C | Э 042D | Ю 042E | Я 042F |
E_ 224 | а 0430 | б 0431 | en 0432 | г 0433 | д 0434 | е 0435 | ж 0436 | § 0437 | и 0438 | © 0439 | к 043A | л 043B | м 043C | н 043D | о 043E | п 043F |
F_ 240 | р 0440 | с 0441 | т 0442 | у 0443 | ф 0444 | х 0445 | ц 0446 | ч 0447 | ø 0448 | щ 0449 | ъ 044A | ы 044B | ь 044C | э 044D | ю 044E | я 044F |
Letra Número Puntuación Símbolo Otro Indefinido Desvío de ISO-IR-111 (excluidas las desviaciones en el caso solamente)
Ver también
- Codificaciones de caracteres KOI
Referencias
- ^ ECMA (1 de agosto de 1985). Parte derecha del alfabeto cirílico (PDF) . ITSCJ / IPSJ . ISO-IR -111.
- ^ a b "Juegos de caracteres" . IANA.
- ^ ECMA-113. Conjuntos de caracteres gráficos codificados de un solo byte de 8 bits - Alfabeto latino / cirílico (1a ed., Junio de 1986)
- ^ a b Czyborra, Roman (30 de noviembre de 1998) [25 de mayo de 1998]. "La sopa cirílico de caracteres" . Archivado desde el original el 3 de diciembre de 2016 . Consultado el 3 de diciembre de 2016 .
- ^ a b c ECMA-113. Conjuntos de caracteres gráficos codificados de un solo byte de 8 bits - Alfabeto latino / cirílico (2a ed., Junio de 1988)
- ^ a b c d e Nechayev, Valentin (2013) [2001]. "Revisión del universo de codificaciones cirílicas de 8 bits" . Archivado desde el original el 5 de diciembre de 2016 . Consultado el 5 de diciembre de 2016 .
- ^ a b c Sokolov, Michael (5 de abril de 2003). "ECMA-cirílico alias iso-ir-111 dolor" . Lista de distribución de conjuntos de caracteres IETF .
- ^ "KOI8 Unificado" . Software de punta de los dedos. Archivado desde el original el 9 de enero de 1998 . Consultado el 11 de febrero de 2020 .
- ^ Leisher, Mark (2008) [5 de marzo de 1998]. "KOI8 cirílico unificado a tabla de mapeo Unicode 2.1" . Departamento de Ciencias Matemáticas, Universidad Estatal de Nuevo México . Consultado el 2 de mayo de 2020 .