Página de códigos 866


De Wikipedia, la enciclopedia libre
  (Redirigido desde CP866 )
Saltar a navegación Saltar a búsqueda

La página de códigos 866 ( CCSID 866) [2] (CP 866, "DOS cirílico ruso") [3] es una página de códigos utilizada en DOS y OS / 2 [4] en Rusia para escribir escritura cirílica . [5] [6] Se basa en la "página de códigos alternativa" (en ruso : Альтернативная кодировка ) desarrollada en 1984 en IHNA AS URSS y publicada en 1986 por un grupo de investigación de la Academia de Ciencias de la URSS. [7] La página de códigos fue ampliamente utilizada durante la era DOS porque conserva todos los símbolos pseudográficos depágina de códigos 437 (a diferencia de la " Página de códigos principal " o la página de códigos 855 ) y mantiene el orden alfabético (aunque no contiguo) de las letras cirílicas (a diferencia de KOI8-R ). Inicialmente, esta codificación solo estaba disponible en la versión rusa de MS-DOS 4.01 (1990) y desde MS-DOS 6.22 en cualquier versión de idioma.

El estándar de codificación WHATWG , que especifica las codificaciones de caracteres permitidas en HTML5 que deben admitir los navegadores compatibles, [8] incluye la página de códigos 866. [9] Es la única codificación de un solo byte enumerada que no se nombra como parte de ISO 8859 , Mac Codificación específica del sistema operativo , codificación específica de Microsoft Windows ( Windows-874 o Windows-125x ) o variante KOI-8 . [9] Los autores de nuevas páginas y los diseñadores de nuevos protocolos deben utilizar UTF-8 en su lugar. [10]

No idénticas, pero dos codificaciones muy similares están estandarizadas en GOST R 34.303-92 [11] como KOI-8 N1 y KOI-8 N2 (no confundir con el KOI-8 original ).

Conjunto de caracteres

Cada carácter se muestra con su punto de código Unicode equivalente . Sólo se muestra la segunda mitad de la tabla (puntos de código 128-255), siendo la primera mitad (puntos de código 0-127) la misma que la página de códigos 437 .

  Letra  Número  Símbolo de  puntuación Otro  Indefinido  Diferente de la página de códigos alternativa       

Variantes

Existían algunas variantes de la página de códigos, pero las diferencias estaban principalmente en los últimos 16 puntos de código (240-255).

Página de códigos alternativa

La versión original de la página de códigos de Bryabrin et al. (1986) [7] se denomina "Página de códigos alternativa" (en ruso : Альтернативная кодировка ), para distinguirla de la "Página de códigos principal" (en ruso : Основная кодировка ) por los mismos autores. Solo admite ruso y búlgaro . Es casi igual que la página de códigos 866, excepto para los códigos F2 hexadecimal a F7 hexadecimal (cuya página de códigos 866 cambia a letras ucranianas y bielorrusas ) y los códigos F8 hexadecimal a FB hexadecimal (donde la página de códigos 866 coincide con la página de códigos 437).en lugar de). La fila diferente se muestra a continuación.

  Caracteres posteriormente cambiados por la página de códigos 866

Página de códigos modificada 866

Una variante no oficial con puntos de código 240-255 idénticos a la página de códigos 437 . Sin embargo, la letra Ёё generalmente se coloca en 240 y 241. [18] Esta versión solo admite ruso y búlgaro . La fila diferente se muestra a continuación.

  Diferente de la página de códigos 866 compatible para coincidir con OEM-US

Variantes lituanas

KBL

La página de códigos KBL , conocida extraoficialmente como página de códigos 771, [19] es la codificación de caracteres DOS más antigua para lituano. [20] En su mayoría coincide con la página de códigos 866 y la página de códigos alternativa, pero reemplaza la última fila y algunos caracteres de bloque con letras del alfabeto lituano que de otra manera no están presentes en ASCII. El ruso Ё / ё no es compatible, [20] de manera similar a KOI-7 .

También existe una versión modificada, la página de códigos 773 , que reemplaza las letras cirílicas por letras letonas y estonias . [20]

  Diferente de la página de códigos 866 y la página de códigos alternativa

LST 1284

La norma lituana LST 1284: 1993, conocida como página de códigos 1119 o extraoficialmente como página de códigos 772, [19] coincide principalmente con la página de códigos "modificada" 866, excepto por la adición de comillas en la última fila y el reemplazo del sencillo mixto. -Caracteres de dibujo de cuadro doble con letras lituanas (comparar la página de códigos 850 ). A diferencia de KBL, se mantiene el Ё / ё ruso .

Viene con LST 1283 ( página de códigos 774/1118 ), que codifica las letras lituanas adicionales en las mismas ubicaciones que LST 1284, pero se basa en la página de códigos 437 . Más tarde fue reemplazado por LST 1590-1 ( página de código 775 ), [19] que codifica estas letras lituanas en las mismas ubicaciones, pero no incluye letras cirílicas, reemplazándolas con letras letonas y estonias. [20]

  Diferente de la página de códigos "modificada" 866

Variantes ucranianas y bielorrusas

IBM designa el estándar ucraniano RST 2018-91 como página de código 1125 (CCSID 1125), [25] abreviado CP1125 y también conocido como CP866U, CP866NAV o RUSCII. [26] Coincide con la página de códigos alternativa original para todos los puntos excepto para F2 hexadecimal a F9 hexadecimal inclusive, que se reemplazan con letras ucranianas . [27] Página de códigos / CCSID 1131 [28] [29] coincide con la página de códigos 866 para todos los puntos excepto para F8 hex , F9 hex y FC hex a FE hex inclusive, que se reemplazan con ucraniano y bielorruso que de otro modo faltaríancartas, en el proceso de desplazar el carácter de viñeta (∙) de F9 hexagonal a FE hexagonal . [30] [31] Las diferentes filas se muestran a continuación.

  La página de códigos 1125 es diferente de la página de códigos alternativa
  La página de códigos 1131 es diferente de la página de códigos 866

Actualizaciones del signo euro

La página de códigos de IBM / CCSID 808 es una variante de la página de códigos / CCSID 866; con el símbolo del euro (€, U + 20AC) en la posición FD hexadecimal , en sustitución del signo de moneda universal (¤). [38] [39] [40]

La página de códigos de IBM / CCSID 848 es una variante de la página de códigos / CCSID 1125 con el signo de euro en FD hexadecimal , que reemplaza a ¤. [41] [42] [43]

La página de códigos de IBM / CCSID 849 es una variante de la página de códigos / CCSID 1131 con el signo de euro en FB hexadecimal , que reemplaza a ¤. [44] [45] [46]

GOST R 34.303-92

El estándar GOST R 34.303-92 define dos variantes. La variante más extensa, KOI-8 N2 (pero no debe confundirse con la codificación KOI-8 , que no sigue), coincide con la página de códigos 866 y la página de códigos alternativa hasta la última fila (códigos 240 a 255, o F0 hex a través de FF hex ). Para la última fila, admite letras para bielorruso y ucraniano además del ruso, pero en un diseño no relacionado con la página de códigos 866 o 1125. En particular, incluso el ruso Ё / ё (que no se modificó entre la página de códigos alternativa y la página de códigos 866 ) está en una ubicación diferente. La fila diferente se muestra a continuación. [11]

  Diferente de la página de códigos 866 y la página de códigos alternativa

La otra variante, KOI-8 N1, es un subconjunto de KOI-8 N2 que omite las letras cirílicas no rusas y los caracteres mixtos de dibujo de caja de una o dos líneas , dejándolos vacíos para una mayor internacionalización (comparar con la página de códigos 850 ). Las filas afectadas se muestran a continuación. [11]

Modificación Lehner-Checa

Una modificación no oficial utilizada en el software desarrollado por Michael Lehner y Peter R. Czech . Reemplaza tres símbolos matemáticos con guillemets y el signo de sección que se usan comúnmente en el idioma ruso. (Lehner y el checo también crearon varios conjuntos de caracteres alternativos para otros idiomas europeos, incluido uno basado en CWI-2 para el húngaro , uno basado en Kamenicky para el checo y el eslovaco , una variante de Mazovia para el polaco y una codificación aparentemente única para Lituano . La fila modificada se muestra a continuación.

  Diferente de la página de códigos 866

Variante letona

Una variante de Letonia, compatible con las impresoras Star y FreeDOS, es la página de códigos 3012 . Esta codificación se llama "RusLat". [47]

  Diferente de la página de códigos 866

FreeDOS

FreeDOS proporciona extensiones adicionales no oficiales de la página de códigos 866 para varios idiomas no eslavos: [48]

  • 30002 - cirílico tayiko
  • 30008 - Cirílico abjasio y osetio
  • 30010 - Cirílico gagauzo y moldavo
  • 30011 - Distrito Sur Cirílico Ruso ( Kalmyk , Karachay-Balkar , Osetia , Cáucaso del Norte )
  • 30012 - Distritos cirílico ruso siberiano y del Lejano Oriente ( Altai , Buryat , Khakas , Tuvan , Yakut , Tungusic , Paleo-Siberian )
  • 30013 - Cirílico Distrito del Volga - Idiomas turcos ( bashkir , chuvash , tártaro )
  • 30014 - Cirílico Distrito del Volga - Lenguas Finno-Ugric ( Mari , Udmurt )
  • 30015 - Khanty cirílico
  • 30016 - Cirílico Mansi
  • 30017 - Distrito cirílico del noroeste ( Nenets cirílico , Carelio latino, Veps latino )
  • 30018 - Tártaro latino y ruso cirílico
  • 30019 - Latín checheno y cirílico ruso
  • 58152 - Kazajo cirílico con euro
  • 58210 - Azerí cirílico
  • 59234 - Tártaro cirílico
  • 60258 - Latín azerí y cirílico ruso
  • 62306 - Uzbeko cirílico

Código página 900

Antes de que Franz Rau de Microsoft registrara la página de códigos final de Microsoft para el ruso MS-DOS 4.01 en IBM como CP866 en enero de 1990, las versiones en borrador desarrolladas por Yuri Starikov (Юрий Стариков) de Dialogue todavía se llamaban página de códigos 900 internamente. Si bien la documentación se corrigió para reflejar el nuevo nombre antes del lanzamiento del producto, en 1990 se publicaron en la prensa rusa bocetos de versiones preliminares anteriores con el nombre de página de código 900 y sin letras ucranianas y bielorrusas, que se habían agregado en otoño de 1989. . [49] La página de códigos 900 se deslizó a través de la distribución del archivo de información de la página de códigos LCD.CPI de MS-DOS 5.0 ruso. [50]

Notas

  1. ^ Incluye claramente ucraniano y rutenas letras Å y Ї , pero sin І distinta de América I , e implementos ortografía Soviética, es decir, omite Ґ . Estos se agregan en algunas modificaciones.
  2. ^ Incluye únicamente Ў bielorruso, pero no І distinto del latín I (aunque esto se agrega en algunas modificaciones).

Referencias

  1. ^ Juegos de caracteres , Autoridad de números asignados de Internet (IANA), 12 de diciembre de 2018
  2. ^ "Documento de información CCSID 866" . Archivado desde el original el 27 de marzo de 2016.
  3. ↑ a b Steele, Shawn (24 de abril de 1996). "CP866.TXT: cp866_DOSCyrillicRussian a tabla Unicode" . Consorcio Unicode .
  4. ^ "OS / 2" (en ruso). Archivado desde el original el 13 de agosto de 2016 . Consultado el 19 de junio de 2016 .
  5. ^ a b "Documento de información de la página de códigos 866" . Archivado desde el original el 16 de marzo de 2016.
  6. ^ "Páginas de códigos compatibles con Windows: páginas de códigos OEM" . Ir al Centro de desarrollo global . Microsoft. Archivado desde el original el 2 de noviembre de 2011 . Consultado el 11 de octubre de 2011 .
  7. ^ a b (en ruso) Брябрин В. М., Ландау И. Я., Неменман М. Е. О системе кодирования для персональных ЭВМ // Микропроцессорные средства и системы. - 1986. - № 4. - С. 61–64.
  8. ^ "8.2.2.3. Codificaciones de caracteres" . HTML 5.1 2ª edición . W3C . Los agentes de usuario deben admitir las codificaciones definidas en el estándar de codificación WHATWG, incluidas, entre otras, […]
  9. ^ a b van Kesteren, Anne . "Codificaciones heredadas de un solo byte" . Estándar de codificación . WHATWG .
  10. ^ van Kesteren, Anne . "Nombres y etiquetas" . Estándar de codificación . WHATWG .
  11. ^ a b c (en ruso) ГОСТ Р 34.303-92. Наборы 8-битных кодированных символов. 8-битный код обмена и обработки информации. = Juegos de caracteres codificados de 8 bits. Código de 8 bits para intercambio de información.
  12. ^ "OEM 866" . Ir al Centro de desarrollo global . Microsoft. Archivado desde el original el 4 de febrero de 2012 . Consultado el 17 de octubre de 2011 .
  13. van Kesteren, Anne (6 de enero de 2018). "Índice índice-ibm866" . Estándar de codificación . WHATWG .
  14. ^ Página de códigos CPGID 00866 (pdf) (PDF) , IBM
  15. ^ Página de códigos CPGID 00866 (txt) , IBM
  16. ^ Componentes internacionales para Unicode (ICU), ibm-866_P100-1995.ucm , 2002-12-03
  17. ^ (en ruso) Брябрин В. М., Ландау И. Я., Неменман М. Е. О системе кодирования для персональных ЭВМ // Микропроцессорные средства и системы. - 1986. - № 4. - С. 64.
  18. ^ (en ruso) Фигурнов В. Э. IBM PC для пользователя. - 2-е изд. - М .: 1992. - С. 279.
  19. ^ a b c "Páginas de códigos: lista completa" . Aivosto.
  20. ^ a b c d "Rašmenų koduotės" . Lietuvių kalba informacinėse technologijose (en lituano).
  21. ^ "771 kodų lentelė" (en lituano). Likit.
  22. ^ "771 kodų lentelė" . Lietuvių kalba informacinėse technologijose - Rašmenų koduotės (en lituano).
  23. ^ "772 kodų lentelė" (en lituano). Likit.
  24. ^ "772 kodų lentelė" . Lietuvių kalba informacinėse technologijose - Rašmenų koduotės (en lituano).
  25. ^ "Documento de información CCSID 1125" . Archivado desde el original el 2 de diciembre de 2014.
  26. ^ Nechayev, Valentin (2013) [2001]. "Revisión del universo de codificaciones cirílicas de 8 bits" . Archivado desde el original el 5 de diciembre de 2016.
  27. ^ a b Página de códigos CPGID 01125 (pdf) (PDF) , IBM
  28. ^ "Documento de información CCSID 1131" . Archivado desde el original el 27 de marzo de 2016.
  29. ^ "Documento de información de la página de códigos 1131" . Archivado desde el original el 17 de marzo de 2016.
  30. ^ IBM. "Identificadores de página de códigos: CP 01131" . Globalización de IBM . Archivado desde el original el 17 de marzo de 2016.
  31. ^ IBM. "Página de códigos 01131" (PDF) . Archivado desde el original (PDF) el 8 de julio de 2015.
  32. ^ Página de códigos CPGID 01125 (txt) , IBM
  33. ^ Componentes internacionales para Unicode (ICU), ibm-1125_P100-1997.ucm , 2002-12-03
  34. ^ (en ucraniano) РСТ УРСР 2018-91. Система обробки інформації. Кодування символів української абетки 8-бітними кодами.
  35. ^ Página de códigos CPGID 01131 (pdf) (PDF) , IBM
  36. ^ Página de códigos CPGID 01131 (txt) , IBM
  37. ^ Componentes internacionales para Unicode (ICU), ibm-1131_P100-1997.ucm , 2002-12-03
  38. ^ "Documento de información CCSID 808" . Archivado desde el original el 1 de diciembre de 2014.
  39. ^ Página de códigos CPGID 00808 (pdf) (PDF) , IBM
  40. ^ Página de códigos CPGID 00808 (txt) , IBM
  41. ^ "Documento de información CCSID 848" . Archivado desde el original el 1 de diciembre de 2014.
  42. ^ Página de códigos CPGID 00848 (pdf) (PDF) , IBM
  43. ^ Página de códigos CPGID 00848 (txt) , IBM
  44. ^ "Documento de información CCSID 849" . Archivado desde el original el 26 de marzo de 2016.
  45. ^ Página de códigos CPGID 00849 (pdf) (PDF) , IBM
  46. ^ Página de códigos CPGID 00849 (txt) , IBM
  47. ^ "Impresora de matriz de puntos LC-8021, Manual del usuario" (PDF) .
  48. ^ "CPIDOS - archivos CPX (información de la página de códigos) Pack v3.0 - páginas de códigos DOS" . FreeDOS . Archivado desde el original el 12 de mayo de 2018 . Consultado el 30 de enero de 2018 .
  49. Starikov, Yuri (11 de abril de 2005). "15-летию Russian MS-DOS 4.01 посвящается" [15 años de ruso MS-DOS 4.01] (en ruso). Archivado desde el original el 4 de diciembre de 2016 . Consultado el 7 de mayo de 2014 .
  50. Paul, Matthias R. (10 de junio de 2001) [1995]. "Descripción general de las páginas de códigos de DOS, OS / 2 y Windows" (archivo CODEPAGE.LST) (edición preliminar 1.59). Archivado desde el original el 20 de abril de 2016 . Consultado el 20 de agosto de 2016 .

Otras lecturas

  • Kornai, Andras; Birnbaum, David J .; da Cruz, Frank; Davis, Bur; Fowler, George; Paine, Richard B .; Paperno, Slava; Simonsen, Keld J .; Thobe, Glenn E .; Vulis, Dimitri; van Wingen, Johan W. (13 de marzo de 1993). "Preguntas frecuentes sobre la codificación cirílica versión 1.3" . 1.3 . Consultado el 4 de junio de 2020 .
Obtenido de " https://en.wikipedia.org/w/index.php?title=Code_page_866&oldid=1048801353 "