MIME / IANA | IBM866 |
---|---|
Alias | cp866, 866 [1] |
Idioma (s) | Ruso , búlgaro ; Apoyo parcial: ucraniano , [a] , bielorruso [b] |
Estándar | Estándar de codificación WHATWG |
Clasificación | Página de códigos OEM , ASCII extendido |
Se extiende | US-ASCII |
Residencia en | Página de códigos alternativa |
Otras codificaciones relacionadas | (Vea abajo) |
La página de códigos 866 ( CCSID 866) [2] (CP 866, "DOS cirílico ruso") [3] es una página de códigos utilizada en DOS y OS / 2 [4] en Rusia para escribir escritura cirílica . [5] [6] Se basa en la "página de códigos alternativa" (en ruso : Альтернативная кодировка ) desarrollada en 1984 en IHNA AS URSS y publicada en 1986 por un grupo de investigación de la Academia de Ciencias de la URSS. [7] La página de códigos fue ampliamente utilizada durante la era DOS porque conserva todos los símbolos pseudográficos depágina de códigos 437 (a diferencia de la " Página de códigos principal " o la página de códigos 855 ) y mantiene el orden alfabético (aunque no contiguo) de las letras cirílicas (a diferencia de KOI8-R ). Inicialmente, esta codificación solo estaba disponible en la versión rusa de MS-DOS 4.01 (1990) y desde MS-DOS 6.22 en cualquier versión de idioma.
El estándar de codificación WHATWG , que especifica las codificaciones de caracteres permitidas en HTML5 que deben admitir los navegadores compatibles, [8] incluye la página de códigos 866. [9] Es la única codificación de un solo byte enumerada que no se nombra como parte de ISO 8859 , Mac Codificación específica del sistema operativo , codificación específica de Microsoft Windows ( Windows-874 o Windows-125x ) o variante KOI-8 . [9] Los autores de nuevas páginas y los diseñadores de nuevos protocolos deben utilizar UTF-8 en su lugar. [10]
No idénticas, pero dos codificaciones muy similares están estandarizadas en GOST R 34.303-92 [11] como KOI-8 N1 y KOI-8 N2 (no confundir con el KOI-8 original ).
Cada carácter se muestra con su punto de código Unicode equivalente . Sólo se muestra la segunda mitad de la tabla (puntos de código 128-255), siendo la primera mitad (puntos de código 0-127) la misma que la página de códigos 437 .
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8_ 128 | А 0410 | Б 0411 | В 0412 | Г 0413 | Д 0414 | Е 0415 | Ж 0416 | З 0417 | И 0418 | Й 0419 | К 041A | Л 041B | М 041C | Н 041D | О 041E | П 041F |
9_ 144 | Р 0420 | С 0421 | Т 0422 | У 0423 | Ф 0424 | Х 0425 | Ц 0426 | Ч 0427 | Ш 0428 | Щ 0429 | Ъ 042A | Ы 042B | Ь 042C | Э 042D | Ю 042E | Я 042F |
A_ 160 | а 0430 | б 0431 | en 0432 | г 0433 | д 0434 | е 0435 | ж 0436 | § 0437 | и 0438 | © 0439 | к 043A | л 043B | м 043C | н 043D | о 043E | п 043F |
B_ 176 | ° 2591 | ▒ 2592 | ▓ 2593 | │ 2502 | ┤ 2524 | ╡ 2561 | ╢ 2562 | ╖ 2556 | ╕ 2555 | ╣ 2563 | ║ 2551 | ╗ 2557 | ╝ 255D | ╜ 255C | ╛ 255B | ┐ 2510 |
C_ 192 | └ 2514 | ┴ 2534 | ┬ 252C | ├ 251C | ─ 2500 | ┼ 253C | ╞ 255E | ╟ 255F | ╚ 255A | ╔ 2554 | ╩ 2569 | ╦ 2566 | ╠ 2560 | ═ 2550 | ╬ 256C | ╧ 2567 |
D_ 208 | ╨ 2568 | ╤ 2564 | ╥ 2565 | ╙ 2559 | ╘ 2558 | ╒ 2552 | ╓ 2553 | ╫ 256B | ╪ 256A | ┘ 2518 | ┌ 250C | █ 2588 | ▄ 2584 | ▌ 258C | ▐ 2590 | ▀ 2580 |
E_ 224 | р 0440 | с 0441 | т 0442 | у 0443 | ф 0444 | х 0445 | ц 0446 | ч 0447 | ø 0448 | щ 0449 | ъ 044A | ы 044B | ь 044C | э 044D | ю 044E | я 044F |
F_ 240 | Ё 0401 | ё 0451 | Є 0404 | є 0454 | Ї 0407 | ї 0457 | Ў 040E | ў 045E | ° 00B0 | ∙ 2219 | · 00B7 | √ 221A | № 2116 | ¤ 00A4 | ■ 25A0 | NBSP 00A0 |
Letra Número Símbolo de puntuación Otro Indefinido Diferente de la página de códigos alternativa
Existían algunas variantes de la página de códigos, pero las diferencias estaban principalmente en los últimos 16 puntos de código (240-255).
La versión original de la página de códigos de Bryabrin et al. (1986) [7] se denomina "Página de códigos alternativa" (en ruso : Альтернативная кодировка ), para distinguirla de la "Página de códigos principal" (en ruso : Основная кодировка ) por los mismos autores. Solo admite ruso y búlgaro . Es casi igual que la página de códigos 866, excepto para los códigos F2 hexadecimal a F7 hexadecimal (cuya página de códigos 866 cambia a letras ucranianas y bielorrusas ) y los códigos F8 hexadecimal a FB hexadecimal (donde la página de códigos 866 coincide con la página de códigos 437).en lugar de). La fila diferente se muestra a continuación.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
F_ 240 | Ё 0401 | ё 0451 | 🮣 1FBA3 | 🮢 1FBA2 | 🮠 1FBA0 | 🮡 1FBA1 | → 2192 | ← 2190 | ↓ 2193 | ↑ 2191 | ÷ 00F7 | ± 00B1 | № 2116 | ¤ 00A4 | ■ 25A0 | NBSP 00A0 |
Una variante no oficial con puntos de código 240-255 idénticos a la página de códigos 437 . Sin embargo, la letra Ёё generalmente se coloca en 240 y 241. [18] Esta versión solo admite ruso y búlgaro . La fila diferente se muestra a continuación.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
F_ 240 | Ё 0401 | ё 0451 | ≥ 2265 | ≤ 2264 | ⌠ 2320 | ⌡ 2321 | ÷ 00F7 | ≈ 2248 | ° 00B0 | ∙ 2219 | · 00B7 | √ 221A | ⁿ 207F | ² 00B2 | ■ 25A0 | NBSP 00A0 |
La página de códigos KBL , conocida extraoficialmente como página de códigos 771, [19] es la codificación de caracteres DOS más antigua para lituano. [20] En su mayoría coincide con la página de códigos 866 y la página de códigos alternativa, pero reemplaza la última fila y algunos caracteres de bloque con letras del alfabeto lituano que de otra manera no están presentes en ASCII. El ruso Ё / ё no es compatible, [20] de manera similar a KOI-7 .
También existe una versión modificada, la página de códigos 773 , que reemplaza las letras cirílicas por letras letonas y estonias . [20]
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
D_ 208 | ╨ 2568 | ╤ 2564 | ╥ 2565 | ╙ 2559 | ╘ 2558 | ╒ 2552 | ╓ 2553 | ╫ 256B | ╪ 256A | ┘ 2518 | ┌ 250C | █ 2588 | Ą 0104 | ą 0105 | Č 010C | č 010D |
E_ 224 | р 0440 | с 0441 | т 0442 | у 0443 | ф 0444 | х 0445 | ц 0446 | ч 0447 | ø 0448 | щ 0449 | ъ 044A | ы 044B | ь 044C | э 044D | ю 044E | я 044F |
F_ 240 | Ę 0118 | ê 0119 | Ė 0116 | ė 0117 | Į 012E | į 012F | Š 0160 | š 0161 | Ų 0172 | ų 0173 | Ū 016A | ū 016B | Ž 017D | § 017E | ■ 25A0 | NBSP 00A0 |
La norma lituana LST 1284: 1993, conocida como página de códigos 1119 o extraoficialmente como página de códigos 772, [19] coincide principalmente con la página de códigos "modificada" 866, excepto por la adición de comillas en la última fila y el reemplazo del sencillo mixto. -Caracteres de dibujo de cuadro doble con letras lituanas (comparar la página de códigos 850 ). A diferencia de KBL, se mantiene el Ё / ё ruso .
Viene con LST 1283 ( página de códigos 774/1118 ), que codifica las letras lituanas adicionales en las mismas ubicaciones que LST 1284, pero se basa en la página de códigos 437 . Más tarde fue reemplazado por LST 1590-1 ( página de código 775 ), [19] que codifica estas letras lituanas en las mismas ubicaciones, pero no incluye letras cirílicas, reemplazándolas con letras letonas y estonias. [20]
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
B_ 176 | ° 2591 | ▒ 2592 | ▓ 2593 | │ 2502 | ┤ 2524 | Ą 0104 | Č 010C | Ę 0118 | Ė 0116 | ╣ 2563 | ║ 2551 | ╗ 2557 | ╝ 255D | Į 012E | Š 0160 | ┐ 2510 |
C_ 192 | └ 2514 | ┴ 2534 | ┬ 252C | ├ 251C | ─ 2500 | ┼ 253C | Ų 0172 | Ū 016A | ╚ 255A | ╔ 2554 | ╩ 2569 | ╦ 2566 | ╠ 2560 | ═ 2550 | ╬ 256C | Ž 017D |
D_ 208 | ą 0105 | č 010D | ê 0119 | ė 0117 | į 012F | š 0161 | ų 0173 | ū 016B | § 017E | ┘ 2518 | ┌ 250C | █ 2588 | ▄ 2584 | ▌ 258C | ▐ 2590 | ▀ 2580 |
E_ 224 | р 0440 | с 0441 | т 0442 | у 0443 | ф 0444 | х 0445 | ц 0446 | ч 0447 | ø 0448 | щ 0449 | ъ 044A | ы 044B | ь 044C | э 044D | ю 044E | я 044F |
F_ 240 | Ё 0401 | ё 0451 | ≥ 2265 | ≤ 2264 | „ 201E | “ 201C | ÷ 00F7 | ≈ 2248 | ° 00B0 | ∙ 2219 | · 00B7 | √ 221A | ⁿ 207F | ² 00B2 | ■ 25A0 | NBSP 00A0 |
IBM designa el estándar ucraniano RST 2018-91 como página de código 1125 (CCSID 1125), [25] abreviado CP1125 y también conocido como CP866U, CP866NAV o RUSCII. [26] Coincide con la página de códigos alternativa original para todos los puntos excepto para F2 hexadecimal a F9 hexadecimal inclusive, que se reemplazan con letras ucranianas . [27] Página de códigos / CCSID 1131 [28] [29] coincide con la página de códigos 866 para todos los puntos excepto para F8 hex , F9 hex y FC hex a FE hex inclusive, que se reemplazan con ucraniano y bielorruso que de otro modo faltaríancartas, en el proceso de desplazar el carácter de viñeta (∙) de F9 hexagonal a FE hexagonal . [30] [31] Las diferentes filas se muestran a continuación.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
F_ 240 | Ё 0401 | ё 0451 | Ґ 0490 | ґ 0491 | Є 0404 | є 0454 | І 0406 | en 0456 | Ї 0407 | ї 0457 | ÷ 00F7 | ± 00B1 | № 2116 | ¤ 00A4 | ■ 25A0 | NBSP 00A0 |
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
F_ 240 | Ё 0401 | ё 0451 | Є 0404 | є 0454 | Ї 0407 | ї 0457 | Ў 040E | ў 045E | І 0406 | en 0456 | · 00B7 | ¤ 00A4 | Ґ 0490 | ґ 0491 | ∙ 2219 | NBSP 00A0 |
La página de códigos de IBM / CCSID 808 es una variante de la página de códigos / CCSID 866; con el símbolo del euro (€, U + 20AC) en la posición FD hexadecimal , en sustitución del signo de moneda universal (¤). [38] [39] [40]
La página de códigos de IBM / CCSID 848 es una variante de la página de códigos / CCSID 1125 con el signo de euro en FD hexadecimal , que reemplaza a ¤. [41] [42] [43]
La página de códigos de IBM / CCSID 849 es una variante de la página de códigos / CCSID 1131 con el signo de euro en FB hexadecimal , que reemplaza a ¤. [44] [45] [46]
El estándar GOST R 34.303-92 define dos variantes. La variante más extensa, KOI-8 N2 (pero no debe confundirse con la codificación KOI-8 , que no sigue), coincide con la página de códigos 866 y la página de códigos alternativa hasta la última fila (códigos 240 a 255, o F0 hex a través de FF hex ). Para la última fila, admite letras para bielorruso y ucraniano además del ruso, pero en un diseño no relacionado con la página de códigos 866 o 1125. En particular, incluso el ruso Ё / ё (que no se modificó entre la página de códigos alternativa y la página de códigos 866 ) está en una ubicación diferente. La fila diferente se muestra a continuación. [11]
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
F_ 240 | SHY 00AD | № 2116 | Ґ 0490 | ґ 0491 | Ё 0401 | ё 0451 | Є 0404 | є 0454 | І 0406 | en 0456 | Ї 0407 | ї 0457 | Ў 040E | ў 045E | ■ 25A0 | NBSP 00A0 |
La otra variante, KOI-8 N1, es un subconjunto de KOI-8 N2 que omite las letras cirílicas no rusas y los caracteres mixtos de dibujo de caja de una o dos líneas , dejándolos vacíos para una mayor internacionalización (comparar con la página de códigos 850 ). Las filas afectadas se muestran a continuación. [11]
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
B_ 176 | ° 2591 | ▒ 2592 | ▓ 2593 | │ 2502 | ┤ 2524 | ╣ 2563 | ║ 2551 | ╗ 2557 | ╝ 255D | ┐ 2510 | ||||||
C_ 192 | └ 2514 | ┴ 2534 | ┬ 252C | ├ 251C | ─ 2500 | ┼ 253C | ╚ 255A | ╔ 2554 | ╩ 2569 | ╦ 2566 | ╠ 2560 | ═ 2550 | ╬ 256C | |||
D_ 208 | ┘ 2518 | ┌ 250C | █ 2588 | ▄ 2584 | ▌ 258C | ▐ 2590 | ▀ 2580 | |||||||||
E_ 224 | р 0440 | с 0441 | т 0442 | у 0443 | ф 0444 | х 0445 | ц 0446 | ч 0447 | ø 0448 | щ 0449 | ъ 044A | ы 044B | ь 044C | э 044D | ю 044E | я 044F |
F_ 240 | SHY 00AD | № 2116 | Ё 0401 | ё 0451 | ■ 25A0 | NBSP 00A0 |
Una modificación no oficial utilizada en el software desarrollado por Michael Lehner y Peter R. Czech . Reemplaza tres símbolos matemáticos con guillemets y el signo de sección que se usan comúnmente en el idioma ruso. (Lehner y el checo también crearon varios conjuntos de caracteres alternativos para otros idiomas europeos, incluido uno basado en CWI-2 para el húngaro , uno basado en Kamenicky para el checo y el eslovaco , una variante de Mazovia para el polaco y una codificación aparentemente única para Lituano . La fila modificada se muestra a continuación.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
F_ 240 | Ё 0401 | ё 0451 | Є 0404 | є 0454 | Ї 0407 | ї 0457 | Ў 040E | ў 045E | » 00BB | « 00AB | · 00B7 | § 00A7 | № 2116 | ¤ 00A4 | ■ 25A0 | NBSP 00A0 |
Una variante de Letonia, compatible con las impresoras Star y FreeDOS, es la página de códigos 3012 . Esta codificación se llama "RusLat". [47]
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
B_ 176 | ° 2591 | ▒ 2592 | ▓ 2593 | │ 2502 | ┤ 2524 | Ā 0100 | ╢ 2562 | ņ 0146 | ╕ 2555 | ╣ 2563 | ║ 2551 | ╗ 2557 | ╝ 255D | Ō 014C | ╛ 255B | ┐ 2510 |
C_ 192 | └ 2514 | ┴ 2534 | ┬ 252C | ├ 251C | ─ 2500 | ┼ 253C | ā 0101 | ╟ 255F | ╚ 255A | ╔ 2554 | ╩ 2569 | ╦ 2566 | ╠ 2560 | ═ 2550 | ╬ 256C | ╧ 2567 |
D_ 208 | Š 0160 | ╤ 2564 | č 010D | Č 010C | ╘ 2558 | ╒ 2552 | ģ 0123 | Ī 012A | ī 012B | ┘ 2518 | ┌ 250C | █ 2588 | ▄ 2584 | ū 016B | Ū 016A | ▀ 2580 |
E_ 224 | р 0440 | с 0441 | т 0442 | у 0443 | ф 0444 | х 0445 | ц 0446 | ч 0447 | ø 0448 | щ 0449 | ъ 044A | ы 044B | ь 044C | э 044D | ю 044E | я 044F |
F_ 240 | Ē 0112 | ē 0113 | Ģ 0122 | ķ 0137 | Ķ 0136 | ¸ 013C | Ļ 013B | § 017E | Ž 017D | ō 014D | · 00B7 | √ 221A | Ņ 0145 | š 0161 | ■ 25A0 | NBSP 00A0 |
FreeDOS proporciona extensiones adicionales no oficiales de la página de códigos 866 para varios idiomas no eslavos: [48]
Antes de que Franz Rau de Microsoft registrara la página de códigos final de Microsoft para el ruso MS-DOS 4.01 en IBM como CP866 en enero de 1990, las versiones en borrador desarrolladas por Yuri Starikov (Юрий Стариков) de Dialogue todavía se llamaban página de códigos 900 internamente. Si bien la documentación se corrigió para reflejar el nuevo nombre antes del lanzamiento del producto, en 1990 se publicaron en la prensa rusa bocetos de versiones preliminares anteriores con el nombre de página de código 900 y sin letras ucranianas y bielorrusas, que se habían agregado en otoño de 1989. . [49] La página de códigos 900 se deslizó a través de la distribución del archivo de información de la página de códigos LCD.CPI de MS-DOS 5.0 ruso. [50]
Los agentes de usuario deben admitir las codificaciones definidas en el estándar de codificación WHATWG, incluidas, entre otras, […]