KOI ( КОИ ) es una familia de varias páginas de códigos para la escritura cirílica . El nombre significa Kod Obmena Informatsiey (en ruso : Код Обмена Информацией ) que significa "Código para el intercambio de información".
Una característica particular de las páginas de códigos KOI es que el texto sigue siendo legible por humanos cuando se quita el bit más a la izquierda , en caso de que pase inadvertidamente a través de equipos o software que solo puedan manejar caracteres de 7 bits de ancho. Esto se debe a que los caracteres se colocan en un orden especial (128 puntos de código aparte de la letra latina a la que suenan más similares), que, sin embargo, no corresponde al orden alfabético en ningún idioma que esté escrito en cirílico y requiere el uso de tablas de búsqueda para realizar la clasificación .
Estas codificaciones se derivan de ASCII sobre la base de cierta correspondencia entre el latín y el cirílico (casi fonético), que ya se usaba en el dialecto ruso del código Morse y en el código telegráfico MTK-2 . Los primeros 26 caracteres de А (0xE1) en KOI8-R son А, Б, Ц, Д, Е, Ф, Г, Х, И, Й, К, Л, М, Н, О, П, Я, Р, С, Т, У, Ж, В, Ь, Ы, З.
KOI-7
La codificación KOI original (1967) era una página de códigos de 7 bits denominada KOI-7 ( КОИ-7 ), que no contenía letras minúsculas. En KOI-7, los códigos de las 31 o 32 letras rusas están ordenados según las letras latinas. Otros puntos de código son los mismos que en ASCII (sin embargo, el signo de dólar $ (punto de código 24 hex ) puede ser reemplazado por el signo de moneda universal ¤).
KOI-8
KOI-8 (КОИ-8), estandarizado en 1974 por GOST 19768, es una extensión de 8 bits de ASCII . [1] [2] Originalmente solo incluía 32 letras rusas minúsculas y 31 mayúsculas.
Los derivados posteriores de KOI-8 constituyen la familia de codificaciones conocidas como KOI8 , KOI 8 y KOI-8 .
Los miembros de la familia son:
- KOI8-B (con Ё ё y Ъ ) [1]
- KOI8-R / KOI8-RUSSIA para ruso y búlgaro (RFC 1489). [3]
- KOI8-U / KOI8-UCRANIA para ucraniano (RFC 2319). [3]
- KOI8-RU para ucraniano , bielorruso y ruso . [4] [5] [6] [7] [8]
- KOI8-T para tayiko . [9]
- KOI8-C , también KOI8-CA , una propuesta para el Cáucaso y Asia Central ; casi nunca se ha utilizado. [10]
- ISO-IR-111 / KOI8-E [11] (ECMA-113 (1ª ed., 1986), [12] multilingüe para lenguas eslavas).
- KOI8-F , KOI-8 Unificado. Incluye las asignaciones de letras de KOI8-U y KOI8-E, con un subconjunto de los pseudográficos de KOI8-R. [13] [14]
- KOI8-K1 "Cirílico-1" (definido en CSN 36 9103, ST SEV 358-88)
- KOI8-O (anteriormente KOI8-C) para ortografía rusa antigua . [15]
Además, GOST R 34.303-92 define "KOI-8 V1", que es ISO-IR-153 , y "KOI-8 N1" y "KOI-8 N2", que son variantes de la página de códigos 866 . [16] Estos no siguen el diseño KOI-8.
DKOI
DKOI es una codificación basada en EBCDIC utilizada en mainframes ES EVM . Ha sido definido por varios estándares: GOST 19768-74 / ST SEV 358-76, ST SEV 358-88 / GOST 19768-93, CSN 36 9103. [17]
Hay dos variantes:
- DKOI K1 (ДКОИ К1), a cada letra cirílica se le asigna su propio código.
- DKOI K2 (ДКОИ К1), algunas letras cirílicas (А, В, Е, К, М, Н, О, Р, С, Т, Х, а, е, о, р, с, у, х) se fusionan con letras latinas visualmente idénticas.
Variantes latinas
Algunas codificaciones se llaman KOI, pero definen alfabetos latinos:
- KOI8-CS [18] / KOI8-CS2 [17] para checo y eslovaco (ČSN (estándar técnico checo) 369103, ideado por el Comecon . Este código latino con diacríticos , como se usa en checo y eslovaco, en lugar del cirílico, pero La idea básica era la misma: el texto debería permanecer legible con el octavo bit borrado, por ejemplo, Č se convirtió en C, etc.).
- KOI8-L2 "Latin-2" (definido en CSN 36 9103), ISO IR 139 [19] (casi idéntico a ISO 8859-2 (1987), pero tiene el signo del dólar y el signo de la moneda intercambiados)
- DKOI CS2 (definido en CSN 36 9103) [17]
- DKOI L2 (definido en CSN 36 9103) [17]
Referencias
- ↑ a b Czyborra, Roman (30 de noviembre de 1998) [25 de mayo de 1998]. "La sopa cirílico de caracteres" . Archivado desde el original el 3 de diciembre de 2016 . Consultado el 3 de diciembre de 2016 .
- ^ Flohr, Guido; Chernov, Andrey A. (2016) [2006]. "Locale :: RecodeData :: KOI_8 - Rutinas de conversión para KOI-8" . CPAN libintl-perl . 1.0. Archivado desde el original el 15 de enero de 2017 . Consultado el 15 de enero de 2017 .
- ^ a b por Cruz, Frank (2 de abril de 2010). "Nombres de juegos de caracteres Kermit y MIME" . El Proyecto Kermit . Universidad de Columbia , Nueva York, Estados Unidos. Archivado desde el original el 3 de diciembre de 2016 . Consultado el 2 de diciembre de 2016 .
- ^ Yuri Demchenko. Registro de un juego de caracteres cirílico ucraniano KOI8-RU (como extensión del ruso KOI8-R e ISO-IR-111) (borrador de Internet). 1997. (Caducado).
- ^ Flohr, Guido (2016) [2006]. "Locale :: RecodeData :: KOI8_RU - Rutinas de conversión para KOI8-RU" . CPAN libintl-perl . Archivado desde el original el 15 de enero de 2017 . Consultado el 15 de enero de 2017 .
- ^ "Información de la página de códigos SBCS - CPGID: 01167 / Nombre: Bielorruso / Ucraniano KOI8-RU" . Software de IBM: Globalización: Juegos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . IBM . CH 3-3220-050. Archivado desde el original el 18 de febrero de 2017 . Consultado el 18 de febrero de 2017 . [1] [2]
- ^ "Documento de información del CCSID; CCSID 1167; KOI8-RU" . IBM . Archivado desde el original el 18 de febrero de 2017 . Consultado el 18 de febrero de 2017 .
- ^ Leisher, Mark (2008) [20 de diciembre de 1999]. "KOI8-RU Bielorruso / cirílico ucraniano a tabla de mapeo Unicode 2.1" . Departamento de Ciencias Matemáticas, Universidad Estatal de Nuevo México. Archivado desde el original el 19 de febrero de 2017 . Consultado el 18 de febrero de 2017 .
- ^ Flohr, Guido; Davis, Michael (2016) [2006]. "Locale :: RecodeData :: KOI8_T - Rutinas de conversión para KOI8-T" . CPAN libintl-perl . Archivado desde el original el 15 de enero de 2017 . Consultado el 15 de enero de 2017 .
- ^ Discusión
- ^ "Conjuntos de caracteres de IANA" .
- ^ ECMA-113. Conjuntos de caracteres gráficos codificados de un solo byte de 8 bits - Alfabeto latino / cirílico (1a ed., Junio de 1986)
- ^ http://segfault.kiev.ua/cyrillic-encodings/
- ^ Leisher, Mark (2008) [5 de marzo de 1998]. "KOI8 cirílico unificado a tabla de mapeo Unicode 2.1" . Departamento de Ciencias Matemáticas, Universidad Estatal de Nuevo México. Archivado desde el original el 19 de febrero de 2017 . Consultado el 18 de febrero de 2017 .
- ^ Serge Winitzki. Conjunto de caracteres cirílico extendido KOI8-C (borrador de Internet). 2002. (Caducado).
- ^ (en ruso) ГОСТ Р 34.303-92. Наборы 8-битных кодированных символов. 8-битный код обмена и обработки информации. = Juegos de caracteres codificados de 8 bits. Código de 8 bits para intercambio de información.
- ^ a b c d Petrlik, Lukas (19 de junio de 1996). "Explicación del lío de codificación de caracteres checo y eslovaco" . cs-encodings-faq . 1.10. Archivado desde el original el 21 de junio de 2016 . Consultado el 21 de junio de 2016 .
- ^ "Copia archivada" . Archivado desde el original el 21 de marzo de 2011 . Consultado el 19 de abril de 2011 .CS1 maint: copia archivada como título ( enlace )
- ^ ISO-IR-139
Otras lecturas
- Kornai, Andras; Birnbaum, David J .; da Cruz, Frank; Davis, Bur; Fowler, George; Paine, Richard B .; Paperno, Slava; Simonsen, Keld J .; Thobe, Glenn E .; Vulis, Dimitri; van Wingen, Johan W. (13 de marzo de 1993). "Preguntas frecuentes sobre la codificación cirílica versión 1.3" . 1.3 . Consultado el 18 de febrero de 2017 .
- "Kodierungen und Zeichensätze" [Codificaciones y conjuntos de caracteres]. Robotron Technik (Museo virtual de la computadora) (en alemán). 2016-11-29. Código ASCII / Código KOI . Consultado el 21 de febrero de 2017 .
enlaces externos
- "El hogar del KOI8-R desde 1995" . Consultado el 5 de diciembre de 2016 .
- Hohlov, Yu. E. "Representación de información cirílica en forma electrónica - Tablas de juego de caracteres (página de códigos)" . Archivado desde el original el 5 de diciembre de 2016 . Consultado el 5 de diciembre de 2016 .
- Nechayev, Valentin (2013) [2001]. "Revisión del universo de codificaciones cirílicas de 8 bits" . Archivado desde el original el 5 de diciembre de 2016 . Consultado el 5 de diciembre de 2016 .