La OMAPE 449 es un juego de caracteres codificados de 7 bits , ahora tecnológicamente obsoleto , [1] para codificar el idioma árabe .
Alias | iso-ir-89 |
---|---|
Estándar | OMAPE 449, ISO 9036 |
Clasificación | Codificación de 7 bits, modificación ISO 646 no latina con orden de letras naturales |
Sucesor | OMAPE 708 (ISO-8859-6) |
Historia
Este conjunto de caracteres fue ideado por la ahora extinta [2] Organización Árabe de Normalización y Metrología en 1982 [2] para ser el estándar de 7 bits que se utilizará en los países de habla árabe. El diseño de este juego de caracteres se deriva [3] de la ISO 646 de 7 bits (versión de 1973) pero con modificaciones adecuadas para el idioma árabe. En los puntos de código que van desde 0x41 a 0x72 (hexadecimal), las letras latinas fueron reemplazadas por letras árabes. Los signos de puntuación que eran idénticos en las escrituras latina y árabe permanecieron iguales, pero donde diferían (coma, punto y coma, signo de interrogación), los latinos fueron reemplazados por los árabes. Solo se codifican las letras nominales, no las formas preformadas de las letras, por lo que se requiere un procesamiento de conformación para la visualización. Este conjunto de caracteres no es bidireccional y fue diseñado para ser utilizado en escritura de derecha a izquierda. Por lo tanto, los signos de puntuación simétricos ("(", ")", "<", ">", "[", "]", "{" y "}") aparecen invertidos (")", "(", ">", "<", "]", "[", "}" y "{").
La OMAPE 449 fue registrada en el Registro Internacional de Juegos de Caracteres Codificados como IR 089 [3] en 1985 y aprobada como norma ISO como ISO 9036: 1987 Procesamiento de la información - Juego de caracteres codificados en árabe de 7 bits para el intercambio de información . [4]
Conjunto de caracteres
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 | NUL 0000 | SOH 0001 | STX 0002 | ETX 0003 | EOT 0004 | ENQ 0005 | ACK 0006 | BEL 0007 | BS 0008 | HT 0009 | LF 000A | VT 000B | FF 000C | CR 000D | SO 000E | SI 000F |
1_ 16 | DLE 0010 | DC1 0011 | DC2 0012 | DC3 0013 | DC4 0014 | NAK 0015 | SYN 0016 | ETB 0017 | PUEDE 0018 | EM 0019 | SUB 001A | ESC 001B | FS 001C | GS 001D | RS 001E | US 001F |
2_ 32 | SP 0020 | ! 0021 | " 0022 | # 0023 | ¤ 00A4 | % 0025 | & 0026 | « 0027 | ) 0029 | ( 0028 | * 002A | + 002B | ، 060C | - 002D | . 002E | / 002F |
3_ 48 | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ؛ 061B | > 003E | = 003D | < 003C | ؟ 061F |
4_ 64 | @ 0040 | ء 0621 | آ 0622 | أ 0623 | ؤ 0624 | إ 0625 | ئ 0626 | ا 0627 | ب 0628 | ة 0629 | ت 062A | ث 062B | ج 062C | ح 062D | خ 062E | د 062F |
5_ 80 | ذ 0630 | ر 0631 | ز 0632 | س 0633 | ش 0634 | ص 0635 | ض 0636 | ط 0637 | ظ 0638 | ع 0639 | غ 063A | ] 005D | \ 005C | [ 005B | ^ 005E | _ 005F |
6_ 96 | 0640 | En 0641 | ق 0642 | ك 0643 | ل 0644 | م 0645 | ن 0646 | ه 0647 | و 0648 | ى 0649 | ي 064A | 064B | 064C | 064D | 064E | 064F |
7_ 112 | 0650 | 0651 | 0652 | } 007D | | 007C | { 007B | ~ 007E | DEL 007F |
Letra Número Puntuación Símbolo Otro Indefinido
Existe una variante, a veces llamado OMAPE 449+ [5] que añade el caracteres NBSP en 0x75, "ﹳ" en el 0x76, "لآ" en el 0x77, "لأ" en el 0x78, "لإ" en 0x79 y "لا" en 0x7A .
Relación con otros conjuntos de caracteres
La OMAPE 449 es un juego de caracteres de 7 bits. Aunque algunas codificaciones asignan este juego de caracteres de 7 bits en la parte superior del juego de caracteres de 8 bits, no debe confundirse con la OMAPE 708 . En los juegos de caracteres que asignan a la OMAPE 449 (o alguna de sus variantes) en la parte superior del juego de caracteres de 8 bits, la existencia de caracteres aparentemente repetidos se debe al hecho de que los caracteres de la parte inferior son de izquierda a derecha. -guión derecha mientras que los caracteres en la parte superior son para escritura de derecha a izquierda. Cuando la OMAPE 449 (o alguna de sus variantes) se asigna a la parte superior del juego de caracteres de 8 bits, tiene dígitos arábigos .
- Al-Arabi [5] agrega los caracteres NBS en 0xF5, "-" en 0xF6, "÷" en 0xF7, "×" en 0xF8, "« "en 0xF9 y" »" en 0xFA, y reemplaza "ـ" por " `"; este conjunto de caracteres a veces se denomina Página de códigos 768 (no es una página de códigos oficial de IBM).
- El DEC / 8 / ASMO [5] de DEC tiene el mismo repertorio y la misma secuencia de caracteres árabes, pero los disloca.
- El árabe-8 de HP [5] también se basa en la OMAPE 449;
- MacArabic de Apple agrega caracteres en francés, alemán y español en sus puntos de código típicos de MacRoman , y agrega letras para persa y urdu.
- MacFarsi de Apple reemplaza los dígitos árabes de MacArabic con persas.
- La tabla de códigos 7 [6] de MARC-8 asigna la OMAPE 449 en la parte inferior del juego de caracteres de 8 bits y asigna la parte superior con la extensión árabe ( ISO 11822 / IR 224).
- La página de códigos 709 de Microsoft , [5] para MS-DOS, agrega caracteres franceses y alemanes en sus puntos de código típicos de la página de códigos 437 .
Referencias
- ^ Computación y el Corán - Algunas advertencias, 2007, Thomas Milo
- ^ a b Le codage informatique de l'écriture arabe: d'ASMO 449 à Unicode et ISO / CEI 10646
- ^ a b "Código árabe de 7 bits para el intercambio de información, norma árabe ASMO-449, ISO 9036" (PDF) . Archivado desde el original (PDF) el 21 de febrero de 2017 . Consultado el 20 de febrero de 2017 .
- ^ ISO 9036: 1987
- ^ a b c d e Manual de referencia del programador de emulación Printronix ACA
- ^ Tabla de códigos 7
enlaces externos
- giconv una interfaz gráfica a una versión de libiconv parcheada que recodifica ASMO449 + a UTF-8
- ISO 9036: 1987 Procesamiento de la información: conjunto de caracteres codificados en árabe de 7 bits para el intercambio de información