ISO / CEI 8859-8 , Tecnología de la información - Juegos de caracteres gráficos codificados de un solo byte de 8 bits - Parte 8: Alfabeto latino / hebreo , es parte de la serie ISO / CEI 8859 de codificaciones de caracteres estándar basadas en ASCII . ISO / IEC 8859-8: 1999 de 1999 representa su segunda y actual revisión, precedida por la primera edición de ISO / IEC 8859-8: 1988 en 1988. Se le conoce informalmente como latín / hebreo . ISO / IEC 8859-8 cubre todas las letras hebreas , pero no los signos vocales hebreos . IBM le asignó la página de códigos 916 ( CCSID 916 y 5012). [2][3] [4] Este conjunto de caracteres también fue adoptado por el estándar israelí SI1311: 2002, con algunas extensiones.
MIME / IANA | ISO-8859-8 |
---|---|
Alias | iso-ir-138, hebreo, csISOLatinHebrew [1] |
Idioma (s) | Hebreo , inglés |
Estándar | ISO / IEC 8859-8, ECMA-121, SI 1311 |
Clasificación | ASCII extendido , ISO 8859 |
Residencia en | DEC hebreo (8 bits) , ISO / IEC 8859-1 |
Otras codificaciones relacionadas | Windows-1255 |
ISO-8859-8 es el nombre de juego de caracteres preferido de IANA para este estándar cuando se complementa con los códigos de control C0 y C1 de ISO / IEC 6429 . El texto está (generalmente) en orden lógico, por lo que se requiere procesamiento bidi para su visualización. Nominalmente, ISO-8859-8 ( página de códigos 28598 ) es para "orden visual", e ISO-8859-8- I ( página de códigos 38598 ) es para orden lógico. Pero generalmente en la práctica, y requerido para documentos XML, [ cita requerida ] ISO-8859-8 también significa texto de orden lógico. El estándar de codificación WHATWG utilizado por HTML5 trata ISO-8859-8 e ISO-8859-8- I como codificaciones distintas con la misma asignación debido a la influencia en la dirección del diseño, pero señala que esto ya no se aplica a ISO-8859-6 ( Árabe), solo según ISO-8859-8. [5]
También existe ISO-8859-8-E que supuestamente requiere que la direccionalidad se especifique explícitamente con caracteres de control especiales; esta última variante no se utiliza en la práctica.
La página de códigos de Microsoft Windows para hebreo, Windows-1255 , es principalmente una extensión de ISO / IEC 8859-8 sin controles C1, excepto por la omisión del doble subrayado y el reemplazo del signo de moneda genérico ( ¤ ) con el signo de sheqel. (₪). Agrega soporte para puntos vocales como combinación de caracteres y algunos signos de puntuación adicionales.
Más de una década después de la publicación de ese estándar, se prefiere Unicode , al menos para Internet [6] (es decir, UTF-8 , la codificación dominante para las páginas web). ISO-8859-8 es utilizado por menos del 0,1% de los sitios web. [7]
Diseño de página de códigos
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 | ||||||||||||||||
1_ 16 | ||||||||||||||||
2_ 32 | SP 0020 | ! 0021 | " 0022 | # 0023 | $ 0024 | % 0025 | & 0026 | « 0027 | ( 0028 | ) 0029 | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F |
3_ 48 | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | < 003C | = 003D | > 003E | ? 003F |
4_ 64 | @ 0040 | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | Yo 0049 | J 004A | K 004B | L 004C | M 004D | N 004E | O 004F |
5_ 80 | P 0050 | Q 0051 | R 0052 | S 0053 | T 0054 | U 0055 | V 0056 | W 0057 | X 0058 | Y 0059 | Z 005A | [ 005B | \ 005C | ] 005D | ^ 005E | _ 005F |
6_ 96 | ` 0060 | un 0061 | b 0062 | c 0063 | d 0064 | e 0065 | f 0066 | g 0067 | h 0068 | yo 0069 | j 006A | k 006B | l 006C | m 006D | n 006E | o 006F |
7_ 112 | p 0070 | q 0071 | r 0072 | s 0073 | t 0074 | u 0075 | v 0076 | w 0077 | x 0078 | y 0079 | z 007A | { 007B | | 007C | } 007D | ~ 007E | |
8_ 128 | ||||||||||||||||
9_ 144 | ||||||||||||||||
A_ 160 | NBSP 00A0 | ¢ 00A2 | £ 00A3 | ¤ 00A4 | ¥ 00A5 | ¦ 00A6 | § 00A7 | ¨ 00A8 | © 00A9 | × 00D7 | « 00AB | ¬ 00AC | SHY 00AD | ® 00AE | ¯ 00AF | |
B_ 176 | ° 00B0 | ± 00B1 | ² 00B2 | ³ 00B3 | ´ 00B4 | µ 00B5 | ¶ 00B6 | · 00B7 | ¸ 00B8 | ¹ 00B9 | ÷ 00F7 | » 00BB | ¼ 00BC | ½ 00BD | ¾ 00BE | |
C_ 192 | ||||||||||||||||
D_ 208 | ‗ 2017 | |||||||||||||||
E_ 224 | א 05D0 | ב 05D1 | ג 05D2 | ד 05D3 | ה 05D4 | ו 05D5 | ז 05D6 | ח 05D7 | ט 05D8 | י 05D9 | ך 05DA | כ 05DB | ל 05DC | ם 05DD | מ 05DE | ן 05DF |
F_ 240 | נ 05E0 | ס 05E1 | ע 05E2 | ף 05E3 | פ 05E4 | ץ 05E5 | צ 05E6 | ק 05E7 | ר 05E8 | ש 05E9 | ת 05EA | LRM 200E | RLM 200F |
Letra Número Puntuación Símbolo Otro Indefinido
FD es una marca de izquierda a derecha (U + 200E) y FE es una marca de derecha a izquierda (U + 200F), como se especifica en una enmienda más reciente como ISO / IEC 8859-8: 1999.
2002 Extensiones del estándar israelí
El estándar israelí SI1311: 2002 coincide con ISO / IEC 8859-8: 1999, excepto por una serie de asignaciones de caracteres adicionales para el signo del euro , el nuevo signo de shekel y un formato bidireccional explícito más avanzado . [12]
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
D_ 208 | 20 € AC | ₪ 20AA | LRO 202D | RLO 202E | PDF 202C | ‗ 2017 | ||||||||||
E_ 224 | א 05D0 | ב 05D1 | ג 05D2 | ד 05D3 | ה 05D4 | ו 05D5 | ז 05D6 | ח 05D7 | ט 05D8 | י 05D9 | ך 05DA | כ 05DB | ל 05DC | ם 05DD | מ 05DE | ן 05DF |
F_ 240 | נ 05E0 | ס 05E1 | ע 05E2 | ף 05E3 | פ 05E4 | ץ 05E5 | צ 05E6 | ק 05E7 | ר 05E8 | ש 05E9 | ת 05EA | LRE 202A | RLE 202B | LRM 200E | RLM 200F |
Ver también
- DEC hebreo de 8 bits (página de códigos DEC similar)
- Página de códigos 1255 (página de códigos de Windows similar)
- SI 960
- Hebreo DEC de 7 bits
Referencias
- ^ Juegos de caracteres , Autoridad de números asignados de Internet (IANA), 12 de diciembre de 2018
- ^ "Documento de información de la página de códigos 916" . Archivado desde el original el 16 de febrero de 2017.
- ^ "Documento de información CCSID 916" . Archivado desde el original el 29 de noviembre de 2014.
- ^ "Documento de información CCSID 5012" . Archivado desde el original el 27 de marzo de 2016.
- ^ van Kesteren, Anne . "9. Codificaciones heredadas de un solo byte" . Estándar de codificación . WHATWG .
Nota: ISO-8859-8 e ISO-8859-8- I son nombres de codificación distintos, porque ISO-8859-8 influye en la dirección del diseño. Y aunque históricamente este podría haber sido el caso de ISO-8859-6 e "ISO-8859-6- I " también, eso ya no es cierto.
- ^ John, Nicholas A. (2013). "La construcción de la Internet multilingüe: Unicode, hebreo y globalización" . Revista de comunicación mediada por computadora . 18 (3): 321–338. doi : 10.1111 / jcc4.12015 . ISSN 1083-6101 .
Antecedentes: el problema del hebreo e Internet
- ^ "Estadísticas de uso de ISO-8859-8 para sitios web, enero de 2019" . w3techs.com . Consultado el 17 de enero de 2019 .
- ^ Página de códigos CPGID 00916 (pdf) (PDF) , IBM
- ^ Página de códigos CPGID 00916 (txt) , IBM
- ^ Componentes internacionales para Unicode (ICU), ibm-916_P100-1995.ucm , 2002-12-03
- ^ Componentes internacionales para Unicode (ICU), ibm-5012_P100-1999.ucm , 2002-12-03
- ^ a b Institución de Normas de Israel . "ISO-IR 234: juego de caracteres latinos / hebreos para códigos de 8 bits" (PDF) . Información de la Comisión de Normas de Tecnología de Japón (ITSCJ / IPSJ ).
enlaces externos
- ISO / IEC 8859-8: 1999
- Revisiones del estándar ECMA :
- Estándar ECMA-121 - Juegos de caracteres gráficos codificados de un solo byte de 8 bits - Alfabeto latino / hebreo (PDF) (1 ed.). Asociación Europea de Fabricantes de Computadoras (ECMA). Julio de 1987. Archivado (PDF) desde el original el 15 de febrero de 2017 . Consultado el 15 de febrero de 2016 .
- Estándar ECMA-121 - Juegos de caracteres gráficos codificados de un solo byte de 8 bits - Alfabeto latino / hebreo (PDF) (2 ed.). Asociación Europea de Fabricantes de Computadoras (ECMA). Diciembre de 2000. Archivado (PDF) desde el original el 15 de febrero de 2017 . Consultado el 15 de febrero de 2016 .( [1] )
- Estándar israelí SI1311: 2002 (hebreo)
- Registros ISO-IR:
- De ECMA-121: 1987 y siguiendo ISO / IEC 8859-8: 1988: Asociación Europea de Fabricantes de Computadoras (1987-07-31). ISO-IR 138 - Alfabeto latino / hebreo (PDF) . Información de la Comisión de Normas de Tecnología de Japón (ITSCJ / IPSJ ). Archivado (PDF) desde el original el 15 de febrero de 2017 . Consultado el 17 de agosto de 2019 .
- Según ISO / IEC 8859-8: 1999 y ECMA-121: 2000: Institución de Normas de Israel (1998-05-01). ISO-IR 198 - Alfabeto latino / hebreo (PDF) . Información de la Comisión de Normas de Tecnología de Japón (ITSCJ / IPSJ ). Archivado (PDF) desde el original el 15 de febrero de 2017 . Consultado el 15 de febrero de 2017 .
- De SI 1311: 2002: Institución de Normas de Israel (2004-07-20). ISO-IR 234: conjunto de caracteres latinos / hebreos para códigos de 8 bits (PDF) . Información de la Comisión de Normas de Tecnología de Japón (ITSCJ / IPSJ ). Archivado (PDF) desde el original el 15 de febrero de 2017 . Consultado el 15 de febrero de 2017 .