De Wikipedia, la enciclopedia libre
  (Redirigido desde ISO-IR-201 )
Saltar a navegación Saltar a búsqueda

ISO / IEC 8859-5: 1999 , Tecnología de la información - Juegos de caracteres gráficos codificados de un solo byte de 8 bits - Parte 5: Alfabeto latino / cirílico , es parte de la serie ISO / IEC 8859 de codificaciones de caracteres estándar basadas en ASCII , primera edición publicado en 1988. Se le conoce informalmente como latino / cirílico . Fue diseñado para cubrir idiomas que utilizan un alfabeto cirílico como el búlgaro , bielorruso , ruso , serbio y macedonio, pero nunca se usó ampliamente. También habría sido útil para los ucranianos en la Unión Soviética.de 1933 a 1990, pero falta la letra ucraniana ge , ґ, que se requiere en la ortografía ucraniana antes y después, y durante ese período fuera de la Ucrania soviética . Como resultado, IBM creó la página de códigos 1124 .

ISO-8859-5 es el nombre de juego de caracteres preferido de IANA para este estándar cuando se complementa con los códigos de control C0 y C1 de ISO / IEC 6429 .

Las codificaciones de 8 bits KOI8-R y KOI8-U , CP866 y también Windows-1251 se utilizan con mucha más frecuencia. A diferencia de Windows-1252 e ISO 8859-1 , Windows-1251 no está estrechamente relacionado con ISO 8859-5. La página de códigos de Windows para ISO-8859-5 es la página de códigos 28595, también conocida como Windows-28595 . [3]

El bloque cirílico principal Unicode utiliza un diseño basado en ISO-8859-5.

Diseño de página de códigos [ editar ]

Cada carácter se muestra con su equivalente Unicode .

  Letra  Número  Puntuación  Símbolo  Otro  Indefinido

Historial y páginas de códigos relacionados [ editar ]

El estándar ECMA-113 ha sido equivalente a ISO-8859-5 desde su segunda edición, [4] su primera edición ( ISO-IR-111 ) ha sido una extensión del anterior KOI-8 (definido por GOST 19768-74) , que presenta las letras rusas de la misma manera que sus equivalentes romanos ASCII siempre que sea posible. El borrador inicial de ISO-8859-5 (DIS-8859-5: 1987) siguió a ISO-IR-111, pero fue revisado [4] después de que GOST 19768-74 fuera reemplazado [5] por el nuevo ISO-IR-153 en 1987, que reorganizó las letras rusas en orden alfabético (excepto Ё). [5] [6]ISO-IR-153 contiene las letras rusas, incluido Ё, y el espacio que no se separa y el guión suave, mientras que el conjunto cirílico completo de ISO-8859-5 también se denomina ISO-IR-144. [7]

Posiblemente como consecuencia de esta confusión, RFC  1345 enumera erróneamente otra página de códigos como "ISO-IR-111", combinando el orden de letras y el orden de mayúsculas y minúsculas de ISO-8859-5 con el orden de filas de ISO-IR-111 (y consecuentemente compatible con ninguno de los dos en la práctica, pero en la práctica es parcialmente compatible [2] con Windows-1251 ). [8] [2]

La página de códigos de IBM 915 es una extensión de ISO / IEC 8859-5, que agrega algunos símbolos semigráficos y de otro tipo en el área C1 . La página de códigos IBM 1124 es casi idéntica a ISO-8859-5, pero reemplaza ѓ por ґ para uso en Ucrania .

ISO-IR-200 , "Uralic Supplementary Cirillic Set", [9] fue registrado en 1998 por Everson Gunn Teoranta (del cual Michael Everson fue director, antes de la fundación de Evertype en 2001), [10] y cambia varios de las letras no rusas para admitir los idiomas Kildin Sami , Komi y Nenets , no admitidos por ISO-8859-5 en sí. Michael Everson también presentó Mac OS Barents Cyrillic para los mismos idiomas en el Mac OS clásico.

La norma ISO-IR-201, "Conjunto cirílico suplementario volgaico", [11] fue introducida de manera similar por Everson Gunn Teoranta para admitir las lenguas chuvash , komi , mari y udmurt , habladas en las repúblicas titulares de Rusia .

Referencias [ editar ]

  1. ^ Juegos de caracteres , Autoridad de números asignados de Internet (IANA), 12 de diciembre de 2018
  2. ↑ a b c Nechayev, Valentin (2013) [2001]. "Revisión del universo de codificaciones cirílicas de 8 bits" . Archivado desde el original el 5 de diciembre de 2016 . Consultado el 5 de diciembre de 2016 .
  3. ^ Identificadores de página de códigos
  4. ^ a b ECMA-113. Juegos de caracteres gráficos codificados de un solo byte de 8 bits - Alfabeto latino / cirílico (2a ed., Junio ​​de 1988)
  5. ↑ a b Czyborra, Roman (30 de noviembre de 1998) [25 de mayo de 1998]. "La sopa de caracteres cirílicos" . Archivado desde el original el 3 de diciembre de 2016 . Consultado el 3 de diciembre de 2016 .
  6. ^ http://czyborra.com/charsets/gost19768-87.txt.gz
  7. ^ "ISO-IR-144" (PDF) . 1 de mayo de 1988.
  8. Sokolov, Michael (5 de abril de 2003). "ECMA-cirílico alias iso-ir-111 dolor" . Lista de distribución de conjuntos de caracteres IETF .
  9. ^ a b "ISO-IR 200: conjunto cirílico suplementario urálico" (PDF) .
  10. ^ Gunn, Marion; Everson, Michael (20 de septiembre de 2001). "Everson Gunn Teoranta (EGT) y tipografía Everson" . Archivo de lista de correo Unicode . Consorcio Unicode.
  11. ^ a b "ISO-IR 201: Conjunto cirílico suplementario volgaico" (PDF) .

Enlaces externos [ editar ]

  • ISO / IEC 8859-5: 1999
  • Estándar ECMA-113 : Juegos de caracteres gráficos codificados de un solo byte de 8 bits - Alfabeto latino / cirílico 3.a edición (diciembre de 1999)
  • ISO-IR 144 Parte cirílica del alfabeto latino / cirílico (1 de mayo de 1988, de ISO 8859-5 2da versión)