La página de códigos 37 ( CCSID 37; etiqueta IBM037
), [1] conocida como "EE.UU. / Canadá - CECP", es una página de códigos EBCDIC utilizada en mainframes de IBM. Se codifica la ISO / IEC 8859-1 repertorio de caracteres gráficos.
MIME / IANA | IBM037 |
---|---|
Alias | cp037, ebcdic-cp-us, ebcdic-cp-ca, ebcdic-cp-wt, ebcdic-cp-nl, csIBM037 [1] |
Clasificación | EBCDIC |
Transforma / Codifica | ISO / IEC 8859-1 |
Otras codificaciones relacionadas | EBCDIC 37-2 , 500 , 924 , 1047 , 1140 |
La página de códigos 37 es una de las páginas de códigos EBCDIC más utilizadas y mejor admitidas. Se utiliza como página de códigos de z / OS predeterminada en los Estados Unidos y otros países de habla inglesa. [2] Se considera la página de códigos EBCDIC "requerida" para los Estados Unidos, [3] y también se utiliza en Australia , Nueva Zelanda , los Países Bajos , Portugal y Brasil , y en los sistemas ESA / 390 en Canadá , [4] pero no en los sistemas canadienses AS / 400 , que utilizan la página de códigos 500 en su lugar. [5]Es una de las cuatro páginas de códigos EBCDIC (junto con 500, 875 y 1026) con datos de mapeo proporcionados por Microsoft al Consorcio Unicode , [6] y una de las siete (junto con 273, 424, 500, 875, 1026 y 1140 ) compatibles con Python como estándar. [7]
Conjunto de caracteres
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | NUL 0000 | SOH 0001 | STX 0002 | ETX 0003 | SEL | HT 0009 | RNL | DEL 007F | GE | SPS | RPT | VT 000B | FF 000C | CR 000D | SO 000E | SI 000F |
1_ | DLE 0010 | DC1 0011 | DC2 0012 | DC3 0013 | res / enp | NL 0085 | BS 0008 | POC | PUEDE 0018 | EM 0019 | UBS | CU1 | IFS 001C | IGS 001D | IRS 001E | ius / itb 001F |
2_ | DS | llamada de socorro | FS | WUS | byp / inp | LF 000A | ETB 0017 | ESC 001B | SA | SFE | sm / sw | CSP | MFA | ENQ 0005 | ACK 0006 | BEL 0007 |
3_ | SYN 0016 | IR | PÁGINAS | TRN | Oficina nacional de normas | EOT 0004 | SBS | ESO | RFF | CU3 | DC4 0014 | NAK 0015 | SUB 001A | |||
4_ | SP 0020 | NBSP 00A0 | â 00E | ä 00E4 | à 00E0 | á 00E1 | ã 00E3 | å 00E5 | ç 00E7 | ñ 00F1 | ¢ 00A | . 002E | < 003C | ( 0028 | + 002B | | 007C |
5_ | & 0026 | é 00E9 | ê 00EA | ë 00EB | è 00E8 | í 00ED | î 00EE | ï 00EF | ì 00EC | ß 00DF | ! 0021 | $ 0024 | * 002A | ) 0029 | ; 003B | ¬ 00AC |
6_ | - 002D | / 002F | Â 00C | Ä 00C4 | À 00C0 | Á 00C1 | Ã 00C3 | Å 00C5 | Ç 00C7 | Ñ 00D1 | ¦ 00A6 | , 002C | % 0025 | _ 005F | > 003E | ? 003F |
7_ | ø 00F8 | É 00C9 | Ê 00CA | Ë 00CB | È 00C8 | Í 00CD | Î 00CE | Ï 00CF | Ì 00CC | ` 0060 | : 003A | # 0023 | @ 0040 | « 0027 | = 003D | " 002 |
8_ | Ø 00D8 | un 0061 | b 006 | c 0063 | d 0064 | e 0065 | f 0066 | g 0067 | h 0068 | yo 0069 | « 00AB | » 00BB | ð 00F0 | ý 00FD | þ 00FE | ± 00B1 |
9_ | ° 00B0 | j 006A | k 006B | l 006C | m 006D | n 006E | o 006F | p 0070 | q 0071 | r 007 | ª 00AA | º 00BA | æ 00E6 | ¸ 00B8 | Æ 00C6 | ¤ 00A4 |
A_ | µ 00B5 | ~ 007E | s 0073 | t 0074 | u 0075 | v 0076 | w 0077 | x 0078 | y 0079 | z 007A | ¡ 00A1 | ¿ 00BF | Ð 00D0 | Ý 00DD | Þ 00DE | ® 00AE |
B_ | ^ 005E | £ 00A3 | ¥ 00A5 | · 00B7 | © 00A9 | § 00A7 | ¶ 00B6 | ¼ 00BC | ½ 00BD | ¾ 00BE | [ 005B | ] 005D | ¯ 00AF | ¨ 00A8 | ´ 00B4 | × 00D7 |
C_ | { 007B | A 0041 | B 004 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | Yo 0049 | SHY 00AD | ô 00F4 | ö 00F6 | ò 00F | ó 00F3 | õ 00F5 |
D_ | } 007D | J 004A | K 004B | L 004C | M 004D | N 004E | O 004F | P 0050 | Q 0051 | R 0052 | ¹ 00B9 | û 00FB | ü 00FC | ù 00F9 | ú 00FA | ÿ 00FF |
MI_ | \ 005C | ÷ 00F7 | S 0053 | T 0054 | U 0055 | V 0056 | W 0057 | X 0058 | Y 0059 | Z 005A | ² 00B | Ô 00D4 | Ö 00D6 | Ò 00D | Ó 00D3 | Õ 00D5 |
F_ | 0 0030 | 1 0031 | 2 003 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | ³ 00B3 | Û 00DB | Ü 00DC | Ù 00D9 | Ú 00DA | EO |
Letra Número Puntuación Símbolo Otro Indefinido
Traducción de la página de códigos
Dado que el CP 037 contiene todos los caracteres latin-1 estándar, es posible traducir los códigos de caracteres del juego de caracteres CP 037 a códigos de caracteres ISO 8859-1 , de modo que la traducción al juego de caracteres CP 037 es una ronda exacta que preserva el valor. -conversión de viaje . Asimismo, la mitad de los códigos de caracteres de control se pueden traducir a sus equivalentes ASCII exactos . Si los restantes caracteres de control únicamente EBCDIC se traducen (arbitrariamente) en los puntos restantes de códigos ASCII no utilizados (hexadecimal 80 a 9F), la traducción resultante cubre todos los 256 puntos de código de caracteres. A continuación se muestra una tabla de traducción de este tipo:
CP 037 → ISO 8859-1 _0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _A _B _C _D _MI _F 0_ 00 01 02 03 9C 09 86 7F 97 8D 8E 0B 0C 0D 0E 0F 1_ 10 11 12 13 9D 85 08 87 18 19 92 8F 1C 1D 1E 1F 2_ 80 81 82 83 84 0A 17 1B 88 89 8A 8B 8C 05 06 07 3_ 90 91 dieciséis 93 94 95 96 04 98 99 9A 9B 14 15 9E 1A 4_ 20 A0 E2 E4 E0 E1 E3 E5 E7 F1 A2 2E 3C 28 2B 7C 5_ 26 E9 EA EB E8 ED EE EF CE DF 21 24 2A 29 3B C.A. 6_ 2D 2F C2 C4 C0 C1 C3 C5 C7 D1 A6 2C 25 5F 3E 3F 7_ F8 C9 California CB C8 CD CE CF CC 60 3A 23 40 27 3D 22 8_ D8 61 62 63 64 sesenta y cinco 66 67 68 69 AB cama y desayuno F0 FD FE B1 9_ B0 6A 6B 6C 6D 6E 6F 70 71 72 Automóvil club británico licenciado en Letras E6 B8 C6 A4 A_ B5 7E 73 74 75 76 77 78 79 7A A1 BF D0 DD Delaware AE B_ 5E A3 A5 B7 A9 A7 B6 antes de Cristo BD SER 5B 5D AF A8 B4 D7 C_ 7B 41 42 43 44 45 46 47 48 49 ANUNCIO F4 F6 F2 F3 F5 D_ 7D 4A 4B 4C 4D 4E 4F 50 51 52 B9 pensión completa FC F9 FA FF MI_ 5C F7 53 54 55 56 57 58 59 5A B2 D4 D6 D2 D3 D5 F_ 30 31 32 33 34 35 36 37 38 39 B3 DB corriente continua D9 DA 9F
Variantes y relación con otras páginas de códigos
Las posiciones del signo de intercalación ( ^
) y no del signo ( ¬
), aunque oficialmente B0 hex y 5F hex respectivamente, a veces se cambian, incluso cuando se usan con APL en el sistema 3279. Esta variante ha sido reconocido por COMPARTIR , pero no designado oficialmente como una página de códigos por IBM, y algunas veces se hace referencia como código de la página 37-2 por transcodificación de software. [10]
Existen varias otras páginas de códigos, que equivalen a la página de códigos 37 con algunos caracteres intercambiados. En particular, la página de códigos 37 codifica los corchetes ( []
) en BA hex y BB hex , mientras que otras variantes utilizan otras codificaciones para los corchetes. Por ejemplo, la página de códigos 1047 es una variante utilizada por el compilador MVS Open Systems. [11] Se diferencia de la página de códigos 37 en seis posiciones: Ý
y [
cambia de lugar, al igual que ¨
y ]
, colocando los corchetes en AD hex y BD hex ; el signo de intercalación y el signo no también cambian de lugar, como en la página de códigos 37-2. [12] [13] Esta codificación de los corchetes se heredó del sistema de visualización 3270. [10] Aunque IBM tiene la intención de que la página de códigos 1047 se utilice solo para cumplir requisitos específicos, y no como reemplazo de las páginas de códigos 37 y 500, [3] el subconjunto de la página de códigos 1047 que codifica el repertorio ASCII se utilizó para el byte único códigos gráficos en UTF-EBCDIC . [11]
La página de códigos 500 , conocida como "EBCDIC internacional", [5] "Latin-1 internacional" o "Número 5 internacional", [10] es la otra codificación EBCDIC importante para el repertorio ISO / IEC 8859-1. Se utiliza en Bélgica , Suiza y en sistemas AS / 400 en Canadá . [5] Está relacionado con la página de códigos 37 y tiene el mismo repertorio, pero difiere en siete posiciones; en particular, codifica [
y ]
en 4A hexadecimal y 5A hexadecimal respectivamente, que se utilizan para el signo de centavo ( ¢
) y el signo de exclamación ( !
) en la página de códigos 37. El signo de intercalación ( ^
) también se codifica en 5F hexadecimal , de forma similar a la página de códigos 37- 2 y 1047. El ¢
está codificado en B0 hex , ¬
en BA hex , !
en 4F hex y el carácter de tubería ( |
) en BB hex . [14] [15] La página de códigos 500 está a su vez relacionada con la página de códigos alemana 273 , que intercambia varios pares de caracteres de una manera correspondiente a las diferencias entre DRV8 e ISO / IEC 8859-1, lo que da como resultado la colocación de los corchetes en 63 hex y FC hex . [dieciséis]
Una variante de la página de códigos 37 con el símbolo del euro ( €
) agregado en la posición hexadecimal 9F , que reemplaza el signo de moneda universal ( ¤
) es la página de códigos 1140 . [17] [18] De manera similar, la página de códigos 1148 realiza el mismo cambio en la página de códigos 500, [19] [20] y la página de códigos 1141 lo hace en la página de códigos 273. [21]
Una página de códigos EBCDIC con el repertorio ISO / IEC 8859-15 , incluido el símbolo del euro, es la página de códigos 924 ; esto está relacionado con la página de códigos 1047 pero con los caracteres ISO / IEC 8859-1 reemplazados con sus reemplazos de ISO / IEC 8859-15, con ¢ y ¬ movidos a sus ubicaciones de la página de códigos 500 en B0 hex y BA hex respectivamente, y con Ý movido a 4A hex . [22]
Ver también
- EBCDIC
Referencias
- ^ a b Conjuntos de caracteres de IANA
- ^ Stephens, David (2011), "Lost in Translation 1 - Páginas de códigos EBCDIC" , LongEx Mainframe Quarterly , Longpela Expertise
- ^ a b "Identificadores de página de códigos: CPGID 1047" . IBM . Archivado desde el original el 7 de junio de 2015.
Esta página de códigos está destinada a un uso limitado para cumplir con requisitos específicos. No pretende sustituir la página de códigos 00037, que es la página de códigos necesaria para los Estados Unidos y varios otros países o la página de códigos 00500.
- ^ "Identificadores de juego de caracteres codificados — CCSID 37" . IBM . Archivado desde el original el 29 de noviembre de 2014.
- ^ a b c "Identificadores de juego de caracteres codificados — CCSID 500" . IBM . Archivado desde el original el 1 de diciembre de 2014.
- ^ "Mapeos | Proveedores | Microsoft | EBCDIC" . Consorcio Unicode .
- ^ "Códecs - Registro de códecs y clases base § Codificaciones estándar" . Documentación de Python . Fundación de software Python .
- ^ Página de códigos CPGID 00037 (pdf) (PDF) , IBM
- ^ Página de códigos CPGID 00037 (txt) , IBM
- ^ a b c xlate - Transliterate Content of Records , IBM Corporation , 2010 [1986], archivado desde el original el 16 de junio de 2019 , consultado el 18 de octubre de 2016
- ^ a b Umamaheswaran, VS (16 de abril de 2002). "UTF-EBCDIC" . Consorcio Unicode . Informe técnico Unicode n. ° 16.
El mapa conserva la invariancia para un conjunto de 82 caracteres gráficos (incluido el ESPACIO) (conocido como el conjunto de caracteres gráficos sintácticos de IBM) y mantiene la coherencia con la página de códigos de sistemas abiertos de IBM MVS (CPGID 1047) para los caracteres variantes de ASCII repertorio.
- ^ "ibm-1047" . Componentes internacionales para Unicode . Explorador de convertidores . Consorcio Unicode .
- ^ "Página de códigos 1047" (PDF) . IBM . Archivado desde el original (PDF) el 8 de julio de 2015.
- ^ "ibm-500" . Componentes internacionales para Unicode . Explorador de convertidores . Consorcio Unicode .
- ^ "Página de códigos 500" (PDF) . IBM . Archivado desde el original (PDF) el 8 de julio de 2015.
- ^ "ibm-273" . Componentes internacionales para Unicode . Explorador de convertidores . Consorcio Unicode .
- ^ "ibm-1140" . Componentes internacionales para Unicode . Explorador de convertidores . Consorcio Unicode .
- ^ "Página de códigos 1140" (PDF) . IBM . Archivado desde el original (PDF) el 8 de julio de 2015.
- ^ "ibm-1140" . Componentes internacionales para Unicode . Explorador de convertidores . Consorcio Unicode .
- ^ "Página de códigos 1148" (PDF) . IBM . Archivado desde el original (PDF) el 8 de julio de 2015.
- ^ "ibm-1141" . Componentes internacionales para Unicode . Explorador de convertidores . Consorcio Unicode .
- ^ "Página de códigos 924" (PDF) . IBM . Archivado desde el original (PDF) el 8 de julio de 2015.
enlaces externos
- Longpela ASCII - convertidor de código EBCDIC 37