ISO-IR-153 [3] (ST SEV 358-88) es un conjunto de caracteres de 8 bits que cubre los alfabetos ruso y búlgaro . A diferencia de las codificaciones KOI , esta codificación enumera las letras cirílicas en su orden tradicional correcto. Esto se ha convertido en la base para ISO / IEC 8859-5 y el bloque Unicode cirílico .
Idioma (s) | Ruso , búlgaro |
---|---|
Estándar | ST SEV 358-88, GOST R 34.303-92 (ver más abajo ) |
Clasificación | ASCII extendido |
Residencia en | Página de códigos principal [1] |
Extensiones | ISO-8859-5 , IBM-1124 , ISO-IR-200 , ISO-IR-201 |
Precedido por | KOI8-B [2] |
Estándares y denominación
ISO-IR-153 es un subconjunto de ISO / IEC 8859-5 (sincronizado con ECMA -113 desde 1988). [4] La documentación ISO-IR-153 cita ST SEV 358-88 como el estándar de origen. [3] Si bien también cita el anterior GOST 19768-74 [3] (que define KOI-8 y fue conforme a la primera versión de ECMA-113, es decir, ISO-IR-111 ), [4] no sigue el diseño KOI-8 (en lugar de utilizar una modificación cercana del diseño de letras de la página de códigos principal ) [1], por lo que parece ser un error. La codificación ISO-IR-153 estaba destinada a reemplazar GOST 19768-74 y, a veces, se la denomina GOST-19768-87. [2] [5] Esta confusión ha llevado a un concepto erróneo común de que ISO-8859-5 se definió en o se basó en GOST 19768-74. [1]
A pesar de la extensión de su exactitud, los IANA listas GOST_19768-74
, ST_SEV_358-88
y iso-ir-153
como etiquetas que pueden usarse para la codificación ISO-IR-153 en la Internet , con referencia a la RFC 1345, que asigna esas etiquetas. [6] [7]
GOST R 34.303-92 incluye la página de códigos ISO-IR-153 y la denomina KOI-8 V1 (además de utilizar KOI-8 N1 y KOI-8 N2 para dos variantes de página de códigos alternativa / página de códigos 866 ). [8]
Conjunto de caracteres
La siguiente tabla muestra la codificación ISO-IR-153. Cada carácter se muestra con su punto de código Unicode equivalente .
La codificación se parece mucho al subconjunto de letras de la parte cirílica de la página de códigos principal , aparte de la reubicación de la mayúscula Ё de 0x F0 a 0xA1. ISO-8859-5 es un superconjunto.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8_ | ||||||||||||||||
9_ | ||||||||||||||||
A_ | NBSP 00A0 | Ё 0401 | SHY 00AD | |||||||||||||
B_ | А 0410 | Б 0411 | В 0412 | Г 0413 | Д 0414 | Е 0415 | Ж 0416 | З 0417 | И 0418 | Й 0419 | К 041A | Л 041B | М 041C | Н 041D | О 041E | П 041F |
C_ | Р 0420 | С 0421 | Т 0422 | У 0423 | Ф 0424 | Х 0425 | Ц 0426 | Ч 0427 | Ш 0428 | Щ 0429 | Ъ 042A | Ы 042B | Ь 042C | Э 042D | Ю 042E | Я 042F |
D_ | а 0430 | б 0431 | en 0432 | г 0433 | д 0434 | е 0435 | ж 0436 | § 0437 | и 0438 | © 0439 | к 043A | л 043B | м 043C | н 043D | о 043E | п 043F |
MI_ | р 0440 | с 0441 | т 0442 | у 0443 | ф 0444 | х 0445 | ц 0446 | ч 0447 | ø 0448 | щ 0449 | ъ 044A | ы 044B | ь 044C | э 044D | ю 044E | я 044F |
F_ | ё 0451 |
Letra Número Puntuación Símbolo Otro Indefinido
Ver también
- ISO-IR-111
Referencias
- ↑ a b c Nechayev, Valentin (2013) [2001]. "Revisión del universo de codificaciones cirílicas de 8 bits" . Archivado desde el original el 5 de diciembre de 2016 . Consultado el 5 de diciembre de 2016 .
- ^ a b Czyborra, Roman (30 de noviembre de 1998) [25 de mayo de 1998]. "La sopa cirílico de caracteres" . Archivado desde el original el 3 de diciembre de 2016 . Consultado el 3 de diciembre de 2016 .
[…] Mientras tanto, GOST había inhalado un poco de perestroika y declaró que la base instalada y la correspondencia de KOI eran menos importantes y revisó su estándar 19768 de 1974 en 1987 en un nuevo GOST 19768-87 incompatible […]
- ^ a b c d ISO-IR-153 (1 de diciembre de 1989)
- ^ a b ECMA-113. Conjuntos de caracteres gráficos codificados de un solo byte de 8 bits - Alfabeto latino / cirílico (2a ed., Junio de 1988)
- ^ http://czyborra.com/charsets/gost19768-87.txt.gz
- ^ "Juegos de caracteres" . IANA.
- ^ Simonsen, Keld (1992). "Mnemónicos de caracteres y conjuntos de caracteres" . Solicitudes de comentarios . IETF . doi : 10.17487 / rfc1345 . RFC 1345.
- ^ (en ruso) ГОСТ Р 34.303-92. Наборы 8-битных кодированных символов. 8-битный код обмена и обработки информации. = Juegos de caracteres codificados de 8 bits. Código de 8 bits para intercambio de información.