MIME / IANA | ISO-8859-8 |
---|---|
Alias | iso-ir-138, hebreo, csISOLatinHebrew [1] |
Idioma (s) | Hebreo , inglés |
Estándar | ISO / IEC 8859-8, ECMA-121, SI 1311 |
Clasificación | ASCII extendido , ISO 8859 |
Residencia en | DEC hebreo (8 bits) , ISO / IEC 8859-1 |
Otras codificaciones relacionadas | Windows-1255 |
ISO / CEI 8859-8 , Tecnología de la información - Juegos de caracteres gráficos codificados de un solo byte de 8 bits - Parte 8: Alfabeto latino / hebreo , es parte de la serie ISO / CEI 8859 de codificaciones de caracteres estándar basadas en ASCII . ISO / IEC 8859-8: 1999 de 1999 representa su segunda y actual revisión, precedida por la primera edición de ISO / IEC 8859-8: 1988 en 1988. Se le conoce informalmente como latín / hebreo . ISO / IEC 8859-8 cubre todas las letras hebreas , pero no los signos vocales hebreos . IBM le asignó la página de códigos 916 ( CCSID 916 y 5012). [2][3] [4] Este conjunto de caracteres también fue adoptado por el estándar israelí SI1311: 2002, con algunas extensiones.
ISO-8859-8 es el nombre de juego de caracteres preferido de IANA para este estándar cuando se complementa con los códigos de control C0 y C1 de ISO / IEC 6429 . El texto está (generalmente) en orden lógico, por lo que se requiere procesamiento bidi para su visualización. Nominalmente, ISO-8859-8 ( página de códigos 28598 ) es para "orden visual", e ISO-8859-8- I ( página de códigos 38598 ) es para orden lógico. Pero generalmente en la práctica, y requerido para documentos XML, [ cita requerida ] ISO-8859-8 también significa texto de orden lógico. El estándar de codificación WHATWG utilizado por HTML5trata ISO-8859-8 e ISO-8859-8- I como codificaciones distintas con el mismo mapeo debido a la influencia en la dirección del diseño, pero señala que esto ya no se aplica a ISO-8859-6 (árabe), solo a ISO- 8859-8. [5]
También existe ISO-8859-8-E que supuestamente requiere que la direccionalidad se especifique explícitamente con caracteres de control especiales; esta última variante no se utiliza en la práctica.
La página de códigos de Microsoft Windows para hebreo, Windows-1255 , es principalmente una extensión de ISO / IEC 8859-8 sin controles C1, excepto por la omisión del doble subrayado y el reemplazo del signo de moneda genérico ( ¤ ) con el signo de sheqel. (₪). Agrega soporte para puntos vocales como combinación de caracteres y algunos signos de puntuación adicionales.
Más de una década después de la publicación de ese estándar, se prefiere Unicode , al menos para Internet [6] (es decir, UTF-8 , la codificación dominante para las páginas web). ISO-8859-8 es utilizado por menos del 0,1% de los sitios web. [7]
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 | ||||||||||||||||
1_ 16 | ||||||||||||||||
2_ 32 | SP 0020 | ! 0021 | " 0022 | # 0023 | $ 0024 | % 0025 | & 0026 | « 0027 | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
3_ 48 | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
4_ 64 | @ 0040 | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | Yo 0049 | J 004A | K 004B | L 004C | M 004D | N 004E | O 004F |
5_ 80 | P 0050 | Q 0051 | R 0052 | S 0053 | T 0054 | U 0055 | V 0056 | W 0057 | X 0058 | Y 0059 | Z 005A | [ 005B | \ 005C | ] 005D | ^ 005E | _ 005F |
6_ 96 | ` 0060 | un 0061 | b 0062 | c 0063 | d 0064 | e 0065 | f 0066 | g 0067 | h 0068 | yo 0069 | j 006A | k 006B | l 006C | m 006D | n 006E | o 006F |
7_ 112 | p 0070 | q 0071 | r 0072 | s 0073 | t 0074 | u 0075 | v 0076 | w 0077 | x 0078 | y 0079 | z 007A | { 007B | | 007C | } 007D | ~ 007E | |
8_ 128 | ||||||||||||||||
9_ 144 | ||||||||||||||||
A_ 160 | NBSP 00A0 | ¢ 00A2 | £ 00A3 | ¤ 00A4 | ¥ 00A5 | ¦ 00A6 | § 00A7 | ¨ 00A8 | © 00A9 | × 00D7 | « 00AB | ¬ 00AC | SHY 00AD | ® 00AE | ¯ 00AF | |
B_ 176 | ° 00B0 | ± 00B1 | ² 00B2 | ³ 00B3 | ´ 00B4 | µ 00B5 | ¶ 00B6 | · 00B7 | ¸ 00B8 | ¹ 00B9 | ÷ 00F7 | » 00BB | ¼ 00BC | ½ 00BD | ¾ 00BE | |
C_ 192 | ||||||||||||||||
D_ 208 | ‗ 2017 | |||||||||||||||
E_ 224 | א 05D0 | ב 05D1 | ג 05D2 | ד 05D3 | ה 05D4 | ו 05D5 | ז 05D6 | ח 05D7 | ט 05D8 | י 05D9 | ך 05DA | כ 05DB | ל 05DC | ם 05DD | מ 05DE | ן 05DF |
F_ 240 | נ 05E0 | ס 05E1 | ע 05E2 | ף 05E3 | פ 05E4 | ץ 05E5 | צ 05E6 | ק 05E7 | ר 05E8 | ש 05E9 | ת 05EA | LRM 200E | RLM 200F |
Letra Número Símbolo de puntuación Otro Indefinido
FD es una marca de izquierda a derecha (U + 200E) y FE es una marca de derecha a izquierda (U + 200F), como se especifica en una enmienda más reciente como ISO / IEC 8859-8: 1999.
El estándar israelí SI1311: 2002 coincide con ISO / IEC 8859-8: 1999 excepto por una serie de asignaciones de caracteres adicionales para el signo del euro , el nuevo signo de shekel y un formato bidireccional explícito más avanzado . [12]
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
D_ 208 | 20 € AC | ₪ 20AA | LRO 202D | RLO 202E | PDF 202C | ‗ 2017 | ||||||||||
E_ 224 | א 05D0 | ב 05D1 | ג 05D2 | ד 05D3 | ה 05D4 | ו 05D5 | ז 05D6 | ח 05D7 | ט 05D8 | י 05D9 | ך 05DA | כ 05DB | ל 05DC | ם 05DD | מ 05DE | ן 05DF |
F_ 240 | נ 05E0 | ס 05E1 | ע 05E2 | ף 05E3 | פ 05E4 | ץ 05E5 | צ 05E6 | ק 05E7 | ר 05E8 | ש 05E9 | ת 05EA | LRE 202A | RLE 202B | LRM 200E | RLM 200F |
Nota: ISO-8859-8 e ISO-8859-8-
I
son nombres de codificación distintos, porque ISO-8859-8 influye en la dirección del diseño.
Y aunque históricamente este podría haber sido el caso de ISO-8859-6 e "ISO-8859-6-
I
" también, eso ya no es cierto.
Antecedentes: el problema del hebreo e Internet