KOI8-R


KOI8-R (RFC 1489) es una codificación de caracteres de 8 bits , derivada de la codificación KOI-8 del programador Andrei Chernov en 1993 y diseñada para abarcar el ruso , que utiliza un alfabeto cirílico . KOI8-R se basó en el código Morse ruso , que se creó a partir de una versión fonética del código Morse latino . Como resultado, las letras cirílicas rusas están en orden pseudo-romano en lugar del orden alfabético cirílico normal. Aunque esto puede parecer poco natural, si se quita el octavo bit, el texto es parcialmente legible en ASCII y puede convertirse a KOI7 sintácticamente correcto .. Por ejemplo, "Русский Текст" en KOI8-R se convierte en rUSSKIJ tEKST ("Texto en ruso").

KOI8 significa Kod Obmena Informatsiey, 8 bits (en ruso : Код Обмена Информацией, 8 бит ) que significa "Código para el intercambio de información, 8 bits". En Microsoft Windows , a KOI8-R se le asigna el número de página de códigos 20866. En IBM , a KOI8-R se le asigna la página de códigos 878. [1] [2] KOI8-R también cubre el búlgaro , pero no se ha utilizado para ese propósito desde que se aceptó CP1251 . El uso de estas páginas de códigos más antiguas está siendo reemplazado por Unicode como una forma más común de representar cirílico junto con otros lenguajes.

Se prefiere Unicode a KOI-8 y sus variantes u otras codificaciones cirílicas en aplicaciones modernas, especialmente en Internet, lo que hace que UTF-8 sea la codificación dominante para las páginas web. (Para obtener más información sobre la cobertura completa de Unicode, de 436 letras cirílicas / puntos de código, incluido el cirílico antiguo , y cómo las codificaciones de caracteres de un solo byte, como las variantes de Windows-1251 y KOI8, no pueden proporcionar esto, consulte Escritura cirílica en Unicode ).

La siguiente tabla muestra la codificación KOI8-R. Cada carácter se muestra con su punto de código Unicode equivalente .