KOI8-U


KOI8-U (RFC 2319) es una codificación de caracteres de 8 bits , diseñada para cubrir el ucraniano , que utiliza un alfabeto cirílico . Se basa en KOI8-R , que cubre el ruso y el búlgaro , pero reemplaza ocho caracteres de dibujo de cuadro con cuatro letras ucranianas Ґ , Є , І y Ї en mayúsculas y minúsculas.

KOI8-RU está estrechamente relacionado, pero agrega Ў para bielorruso . En ambos, las asignaciones de letras coinciden con las de KOI8-E , excepto por Ґ que se agrega a KOI8-F .

En Microsoft Windows , a KOI8-U se le asigna el número de página de códigos 21866. En IBM , a KOI8-U se le asigna la página de códigos/ CCSID 1168. [1] [2] [3]

KOI8 sigue siendo mucho más utilizado que ISO 8859-5 , que nunca se puso de moda. Otra codificación de caracteres cirílicos común es Windows-1251 . En el futuro, ambos pueden eventualmente dar paso a Unicode .

KOI8 significa Kod Obmena Informatsiey, 8 bits ( en ruso : Код Обмена Информацией, 8 бит ), que significa "Código para el intercambio de información, 8 bits".

Los juegos de caracteres KOI8 tienen la propiedad de que las letras cirílicas rusas están en orden pseudo-romano en lugar del orden alfabético cirílico natural como en ISO 8859-5. Aunque esto puede parecer antinatural, tiene la propiedad útil de que si se elimina el octavo bit, el texto aún se puede leer (o al menos descifrar) en transliteración con mayúsculas y minúsculas en un terminal ASCII ordinario. Por ejemplo, "Русский Текст" en KOI8-U se convierte en rUSSKIJ tEKST ("Texto en ruso") si se quita el octavo bit.