ISO / IEC 8859-8


De Wikipedia, la enciclopedia libre
  (Redirigido desde SI 1311 )
Saltar a navegación Saltar a búsqueda

ISO / CEI 8859-8 , Tecnología de la información - Juegos de caracteres gráficos codificados de un solo byte de 8 bits - Parte 8: Alfabeto latino / hebreo , es parte de la serie ISO / CEI 8859 de codificaciones de caracteres estándar basadas en ASCII . ISO / IEC 8859-8: 1999 de 1999 representa su segunda y actual revisión, precedida por la primera edición de ISO / IEC 8859-8: 1988 en 1988. Se le conoce informalmente como latín / hebreo . ISO / IEC 8859-8 cubre todas las letras hebreas , pero no los signos vocales hebreos . IBM le asignó la página de códigos 916 ( CCSID 916 y 5012). [2][3] [4] Este conjunto de caracteres también fue adoptado por el estándar israelí SI1311: 2002, con algunas extensiones.

ISO-8859-8 es el nombre de juego de caracteres preferido de IANA para este estándar cuando se complementa con los códigos de control C0 y C1 de ISO / IEC 6429 . El texto está (generalmente) en orden lógico, por lo que se requiere procesamiento bidi para su visualización. Nominalmente, ISO-8859-8 ( página de códigos 28598 ) es para "orden visual", e ISO-8859-8- I ( página de códigos 38598 ) es para orden lógico. Pero generalmente en la práctica, y requerido para documentos XML, [ cita requerida ] ISO-8859-8 también significa texto de orden lógico. El estándar de codificación WHATWG utilizado por HTML5trata ISO-8859-8 e ISO-8859-8- I como codificaciones distintas con el mismo mapeo debido a la influencia en la dirección del diseño, pero señala que esto ya no se aplica a ISO-8859-6 (árabe), solo a ISO- 8859-8. [5]

También existe ISO-8859-8-E que supuestamente requiere que la direccionalidad se especifique explícitamente con caracteres de control especiales; esta última variante no se utiliza en la práctica.

La página de códigos de Microsoft Windows para hebreo, Windows-1255 , es principalmente una extensión de ISO / IEC 8859-8 sin controles C1, excepto por la omisión del doble subrayado y el reemplazo del signo de moneda genérico ( ¤ ) con el signo de sheqel. (₪). Agrega soporte para puntos vocales como combinación de caracteres y algunos signos de puntuación adicionales.

Más de una década después de la publicación de ese estándar, se prefiere Unicode , al menos para Internet [6] (es decir, UTF-8 , la codificación dominante para las páginas web). ISO-8859-8 es utilizado por menos del 0,1% de los sitios web. [7]

Diseño de página de códigos

  Letra  Número  Símbolo de  puntuación Otro  Indefinido      

  Diferente del hebreo DEC (8 bits) para coincidir con ISO-8859-1 .
  Diferente de DEC hebreo (8 bits) e ISO-8859-1 .

FD es una marca de izquierda a derecha (U + 200E) y FE es una marca de derecha a izquierda (U + 200F), como se especifica en una enmienda más reciente como ISO / IEC 8859-8: 1999.

2002 Extensiones del estándar israelí

El estándar israelí SI1311: 2002 coincide con ISO / IEC 8859-8: 1999 excepto por una serie de asignaciones de caracteres adicionales para el signo del euro , el nuevo signo de shekel y un formato bidireccional explícito más avanzado . [12]

  Ausente de ISO / IEC 8859-8: 1999, agregado en SI1311: 2002.

Ver también

  • DEC hebreo de 8 bits (página de códigos DEC similar)
  • Página de códigos 1255 (página de códigos de Windows similar)
  • SI 960
  • Hebreo DEC de 7 bits

Referencias

  1. ^ Juegos de caracteres , Autoridad de números asignados de Internet (IANA), 12 de diciembre de 2018
  2. ^ "Documento de información de la página de códigos 916" . Archivado desde el original el 16 de febrero de 2017.
  3. ^ "Documento de información CCSID 916" . Archivado desde el original el 29 de noviembre de 2014.
  4. ^ "Documento de información CCSID 5012" . Archivado desde el original el 27 de marzo de 2016.
  5. ^ van Kesteren, Anne . "9. Codificaciones heredadas de un solo byte" . Estándar de codificación . WHATWG . Nota: ISO-8859-8 e ISO-8859-8- I son nombres de codificación distintos, porque ISO-8859-8 influye en la dirección del diseño. Y aunque históricamente este podría haber sido el caso de ISO-8859-6 e "ISO-8859-6- I " también, eso ya no es cierto.
  6. ^ John, Nicholas A. (2013). "La construcción de la Internet multilingüe: Unicode, hebreo y globalización" . Revista de comunicación mediada por computadora . 18 (3): 321–338. doi : 10.1111 / jcc4.12015 . ISSN 1083-6101 . Antecedentes: el problema del hebreo e Internet 
  7. ^ "Estadísticas de uso de ISO-8859-8 para sitios web, enero de 2019" . w3techs.com . Consultado el 17 de enero de 2019 .
  8. ^ Página de códigos CPGID 00916 (pdf) (PDF) , IBM
  9. ^ Página de códigos CPGID 00916 (txt) , IBM
  10. ^ Componentes internacionales para Unicode (ICU), ibm-916_P100-1995.ucm , 2002-12-03
  11. ^ Componentes internacionales para Unicode (ICU), ibm-5012_P100-1999.ucm , 2002-12-03
  12. ^ a b Institución de normas de Israel . "ISO-IR 234: juego de caracteres latinos / hebreos para códigos de 8 bits" (PDF) . Información de la Comisión de Normas de Tecnología de Japón (ITSCJ / IPSJ ).

enlaces externos

  • ISO / IEC 8859-8: 1999
  • Revisiones del estándar ECMA :
    • Estándar ECMA-121 - Juegos de caracteres gráficos codificados de un solo byte de 8 bits - Alfabeto latino / hebreo (PDF) (1 ed.). Asociación Europea de Fabricantes de Computadoras (ECMA). Julio de 1987. Archivado (PDF) desde el original el 15 de febrero de 2017 . Consultado el 15 de febrero de 2016 .
    • Estándar ECMA-121 - Juegos de caracteres gráficos codificados de un solo byte de 8 bits - Alfabeto latino / hebreo (PDF) (2 ed.). Asociación Europea de Fabricantes de Computadoras (ECMA). Diciembre de 2000. Archivado (PDF) desde el original el 15 de febrero de 2017 . Consultado el 15 de febrero de 2016 .( [1] )
  • Estándar israelí SI1311: 2002 (hebreo)
  • Registros ISO-IR:
    • De ECMA-121: 1987 y siguiendo ISO / IEC 8859-8: 1988: Asociación Europea de Fabricantes de Computadoras (1987-07-31). ISO-IR 138 - Alfabeto latino / hebreo (PDF) . Información de la Comisión de Normas de Tecnología de Japón (ITSCJ / IPSJ ). Archivado (PDF) desde el original el 15 de febrero de 2017 . Consultado el 17 de agosto de 2019 .
    • Según ISO / IEC 8859-8: 1999 y ECMA-121: 2000: Instituto de Normas de Israel (1998-05-01). ISO-IR 198 - Alfabeto latino / hebreo (PDF) . Información de la Comisión de Normas de Tecnología de Japón (ITSCJ / IPSJ ). Archivado (PDF) desde el original el 15 de febrero de 2017 . Consultado el 15 de febrero de 2017 .
    • De SI 1311: 2002: Instituto de Normas de Israel (2004-07-20). ISO-IR 234: conjunto de caracteres latinos / hebreos para códigos de 8 bits (PDF) . Información de la Comisión de Normas de Tecnología de Japón (ITSCJ / IPSJ ). Archivado (PDF) desde el original el 15 de febrero de 2017 . Consultado el 15 de febrero de 2017 .
Obtenido de " https://en.wikipedia.org/w/index.php?title=ISO/IEC_8859-8&oldid=1028037165 "