Windows-1256 es una página de códigos que se usa para escribir árabe (y posiblemente algunos otros idiomas que usan escritura árabe , como persa y urdu) en Microsoft Windows . Esta página de códigos no es compatible con las codificaciones ISO 8859-6 y MacArabic .
Codifica todas las letras abstractas del alfabeto árabe básico, no todas las formas visuales concretas de variantes de formas de letras aisladas, iniciales, intermedias, finales o ligadas (es decir, codifica caracteres, no glifos). Las letras árabes en el rango C0-FF están en orden alfabético árabe, pero algunos caracteres latinos se intercalan entre ellos. Estos son algunos caracteres latinos de Windows-1252 utilizados para el francés , ya que este idioma europeo tiene cierta relevancia histórica en las antiguas colonias francesas del norte de África, como Marruecos y Argelia . Esto permitió mezclar texto en francés y árabe cuando se usaba Windows 1256 sin necesidad de cambiar de página de códigos (sin embargo, no se incluyeron letras mayúsculas con diacríticos).
IBM utiliza la página de códigos 1256 ( CCSID 1256, CCSID extendido con el símbolo del euro 5352 y el CCSID ampliado adicionalmente 9448) para Windows-1256. [1] [2] [3] [4]
Se prefiere Unicode sobre Windows 1256 en aplicaciones modernas, especialmente en Internet; es decir, la codificación UTF-8 dominante para páginas web (consulte también la escritura árabe en Unicode para una cobertura completa, a diferencia de Windows 1256 o ISO-8859-6 que no cubren los extras). Menos del 0,1% de todas las páginas web utilizan Windows-1256 en septiembre de 2019. [5] [6]
Conjunto de caracteres
Dado que la página de códigos original dejó 9 valores (bytes) marcados como "NO UTILIZADOS" en la especificación original, [7] estos bytes se usaron más tarde para los caracteres adicionales necesarios para la escritura persaárabe (para los idiomas persa y urdu ), más el signo del euro . [8]
La siguiente tabla muestra la versión extendida de Windows-1256. Cada carácter se muestra con su equivalente Unicode y su código decimal.
Aquí cada letra árabe se muestra de forma aislada. Las formas reales de las letras dentro de las palabras árabes se representan mediante una combinación de reglas de software y compatibilidad con fuentes adecuadas.
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 | NUL 0000 | SOH 0001 | STX 0002 | ETX 0003 | EOT 0004 | ENQ 0005 | ACK 0006 | BEL 0007 | BS 0008 | HT 0009 | LF 000A | VT 000B | FF 000C | CR 000D | SO 000E | SI 000F |
1_ 16 | DLE 0010 | DC1 0011 | DC2 0012 | DC3 0013 | DC4 0014 | NAK 0015 | SYN 0016 | ETB 0017 | PUEDE 0018 | EM 0019 | SUB 001A | ESC 001B | FS 001C | GS 001D | RS 001E | US 001F |
2_ 32 | SP 0020 | ! 0021 | " 0022 | # 0023 | $ 0024 | % 0025 | & 0026 | « 0027 | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
3_ 48 | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
4_ 64 | @ 0040 | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | Yo 0049 | J 004A | K 004B | L 004C | M 004D | N 004E | O 004F |
5_ 80 | P 0050 | Q 0051 | R 0052 | S 0053 | T 0054 | U 0055 | V 0056 | W 0057 | X 0058 | Y 0059 | Z 005A | [ 005B | \ 005C | ] 005D | ^ 005E | _ 005F |
6_ 96 | ` 0060 | un 0061 | b 0062 | c 0063 | d 0064 | e 0065 | f 0066 | g 0067 | h 0068 | yo 0069 | j 006A | k 006B | l 006C | m 006D | n 006E | o 006F |
7_ 112 | p 0070 | q 0071 | r 0072 | s 0073 | t 0074 | u 0075 | v 0076 | w 0077 | x 0078 | y 0079 | z 007A | { 007B | | 007C | } 007D | ~ 007E | DEL 007F |
8_ 128 | 20 € AC | پ 067E | ‚ 201A | ƒ 0192 | „ 201E | ... 2026 | † 2020 | ‡ 2021 | 02C6 | ‰ 2030 | ٹ 0679 | ‹ 2039 | Œ 0152 | چ 0686 | ژ 0698 | ڈ 0688 |
9_ 144 | گ 06AF | ' 2018 | ' 2019 | “ 201C | " 201D | • 2022 | - 2013 | - 2014 | ک 06A9 | ™ 2122 | ڑ 0691 | › 203A | œ 0153 | ZWNJ 200C | ZWJ 200D | ں 06BA |
A_ 160 | NBSP 00A0 | ، 060C | ¢ 00A2 | £ 00A3 | ¤ 00A4 | ¥ 00A5 | ¦ 00A6 | § 00A7 | ¨ 00A8 | © 00A9 | ھ 06BE | « 00AB | ¬ 00AC | SHY 00AD | ® 00AE | ¯ 00AF |
B_ 176 | ° 00B0 | ± 00B1 | ² 00B2 | ³ 00B3 | ´ 00B4 | µ 00B5 | ¶ 00B6 | · 00B7 | ¸ 00B8 | ¹ 00B9 | ؛ 061B | » 00BB | ¼ 00BC | ½ 00BD | ¾ 00BE | ؟ 061F |
C_ 192 | ہ 06C1 | ء 0621 | آ 0622 | أ 0623 | ؤ 0624 | إ 0625 | ئ 0626 | ا 0627 | ب 0628 | ة 0629 | ت 062A | ث 062B | ج 062C | ح 062D | خ 062E | د 062F |
D_ 208 | ذ 0630 | ر 0631 | ز 0632 | س 0633 | ش 0634 | ص 0635 | ض 0636 | × 00D7 | ط 0637 | ظ 0638 | ع 0639 | غ 063A | 0640 | En 0641 | ق 0642 | ك 0643 |
E_ 224 | à 00E0 | ل 0644 | â 00E2 | م 0645 | ن 0646 | ه 0647 | و 0648 | ç 00E7 | è 00E8 | é 00E9 | ê 00EA | ë 00EB | ى 0649 | ي 064A | î 00EE | ï 00EF |
F_ 240 | 064B | 064C | 064D | 064E | ô 00F4 | 064F | 0650 | ÷ 00F7 | 0651 | ù 00F9 | 0652 | û 00FB | ü 00FC | LRM 200E | RLM 200F | ے 06D2 |
Letra Número Puntuación Símbolo Otro Indefinido
Ver también
- LMBCS-4
Referencias
- ^ "Documento de información de la página de códigos 1256" . Archivado desde el original el 3 de marzo de 2016.
- ^ "Documento de información CCSID 1256" . Archivado desde el original el 27 de marzo de 2016.
- ^ "Documento de información CCSID 5352" . Archivado desde el original el 29 de noviembre de 2014.
- ^ "Documento de información CCSID 9448" . Archivado desde el original el 29 de noviembre de 2014.
- ^ "Tendencias históricas en el uso de codificaciones de caracteres para sitios web, septiembre de 2019" . w3techs.com .
- ^ "Preguntas frecuentes" . w3techs.com .
- ^ Archiveddocs. "Página de códigos 1256 Windows árabe" . docs.microsoft.com .
- ^ a b "cp1256 a tabla Unicode" (PDF) . www.unicode.org . Consultado el 31 de mayo de 2019 .
- ^ Asignaciones Unicode de windows 1256 con "mejor ajuste"
- ^ Página de códigos CPGID 01256 (pdf) (PDF) , IBM
- ^ Página de códigos CPGID 01256 (txt) , IBM
- ^ Componentes internacionales para Unicode (ICU), ibm-1256_P110-1997.ucm , 2002-12-03
- ^ Componentes internacionales para Unicode (ICU), ibm-5352_P100-1998.ucm , 2002-12-03
- ^ Componentes internacionales para Unicode (ICU), ibm-9448_X100-2005.ucm , 2005-11-15
enlaces externos
- Cuadro de referencia de Windows 1256
- Registro de nombre de juego de caracteres IANA de windows-1256