La norma ISO 2033: 1983 ( "Codificación de caracteres legibles por máquina (MICR y OCR)" ) [1] define conjuntos de caracteres para su uso con sistemas de reconocimiento óptico de caracteres o de reconocimiento de caracteres con tinta magnética . El estándar japonés JIS X 9010: 1984 ( "Codificación de caracteres legibles por máquina (OCR y MICR)" , originalmente designado como JIS C 6229-1984 ) está estrechamente relacionado. [2]
Juego de caracteres para OCR-A
La versión de la codificación para la fuente OCR-A registrada en el registro ISO-IR como ISO-IR-91 es la versión japonesa (JIS X 9010 / JIS C 6229), que difiere de la codificación definida por ISO 2033 solo en el adición de un signo de Yen (que se muestra sombreado a continuación). [2]
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 | NUL 0000 | SOH 0001 | STX 0002 | ETX 0003 | EOT 0004 | ENQ 0005 | ACK 0006 | BEL 0007 | BS 0008 | HT 0009 | LF 000A | VT 000B | FF 000C | CR 000D | SO 000E | SI 000F |
1_ 16 | DLE 0010 | DC1 0011 | DC2 0012 | DC3 0013 | DC4 0014 | NAK 0015 | SYN 0016 | ETB 0017 | PUEDE 0018 | EM 0019 | SUB 001A | ESC 001B | FS 001C | GS 001D | RS 001E | US 001F |
2_ 32 | SP 0020 | " 0022 | £ 00A3 | $ 0024 | % 0025 | & 0026 | « 0027 | { 007B | } 007D | * 002A | + 002B | , 002C | - 002D | . 002E | / 002F | |
3_ 48 | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | : 003A | ; 003B | ⑀ 2440 | = 003D | ⑁ 2441 | ? 003F |
4_ 64 | A 0041 | B 0042 | C 0043 | D 0044 | E 0045 | F 0046 | G 0047 | H 0048 | Yo 0049 | J 004A | K 004B | L 004C | M 004D | N 004E | O 004F | |
5_ 80 | P 0050 | Q 0051 | R 0052 | S 0053 | T 0054 | U 0055 | V 0056 | W 0057 | X 0058 | Y 0059 | Z 005A | ¥ 00A5 | ⑂ 2442 | |||
6_ 96 | ||||||||||||||||
7_ 112 | | 007C | DEL 007F |
Letra Número Puntuación Símbolo Otro Indefinido Redefinido en comparación con JIS-Roman
Juego de caracteres para OCR-B
La versión del conjunto G0 para la fuente OCR-B registrada en el registro ISO-IR como ISO-IR-92 es la versión japonesa (JIS X 9010 / JIS C 6229), que difiere de la codificación definida por ISO 2033 solo en basado en JIS-Roman (con un signo de dólar en 0x24 y un signo de Yen en 0x5C) en lugar de en el IRV ISO 646 (con una barra invertida en 0x5C y, en ese momento, un signo de moneda universal (¤) en 0x24). [3] Además de esos puntos de código, se diferencia de ASCII solo en que omite el signo arroba (@) y la tilde (~). [3] Un conjunto complementario adicional registrado como ISO-IR-93 asigna el signo de libra (£), el signo de moneda universal (¤) y el signo de sección (§) a sus puntos de código ISO-8859-1 , y la barra invertida a ISO- 8859-1 punto de código para el signo Yen. [4]
Juego de caracteres para JIS X 9008 (JIS C 6257)
JIS X 9010 (JIS C 6229) también define conjuntos de caracteres para la fuente OCR "impresa a mano" JIS X 9008: 1981 (anteriormente JIS C 6257-1981). [5] : fn1 Estos incluyen subconjuntos del conjunto JIS X 0201 Roman (registrado como ISO-IR-94 y omitiendo el signo arroba (@), letras minúsculas, llaves ({,}) y líneas superpuestas (‾)), [ 5] y conjunto de kana (registrado como ISO-IR-96 y omitiendo la coma del estilo de Asia oriental () y punto (。), el interpunto (・) y el kana pequeño), [6] además de un conjunto ( registrado como ISO-IR-95 ) que contiene solo la barra invertida, que se asigna al mismo punto de código que en ISO-IR-93. [7]
La fuente JIS C 6527 estiliza los caracteres de barra [5] y barra invertida [7] con una apariencia doble. Los nombres de caracteres dados son "Solidus" [5] y "Reverse Solidus", [7] que coinciden con los nombres de caracteres Unicode para la barra ASCII y la barra invertida. [8] Sin embargo, el bloque de reconocimiento óptico de caracteres Unicode incluye un punto de código adicional para una "barra invertida doble de OCR" (⑊), aunque no para una barra inclinada doble (hacia adelante). [9]
Juego de caracteres para E-13B
La codificación ISO-IR-98 definida por ISO 2033 codifica el repertorio de caracteres de la fuente E13B , tal como se utiliza con el reconocimiento de caracteres de tinta magnética . [10] Aunque la norma ISO 2033 también especifica otras codificaciones, la codificación para E-13B es la codificación refiere como ISO_2033_1983
por Perl libintl, [11] y como ISO_2033-1983
o csISO2033
por la IANA . [12] Otras etiquetas registradas incluyen iso-ir-98
su número de registro ISO-IR y simplemente e13b
. [12]
Los dígitos se conservan en sus ubicaciones ASCII . Se omiten las letras y símbolos que no están disponibles en la fuente E13B, mientras que se agrega la puntuación especializada para los cheques bancarios incluidos en la fuente E13B. Los mismos símbolos están disponibles en Unicode en el bloque de reconocimiento óptico de caracteres .
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ | NUL 0000 | SOH 0001 | STX 0002 | ETX 0003 | EOT 0004 | ENQ 0005 | ACK 0006 | BEL 0007 | BS 0008 | HT 0009 | LF 000A | VT 000B | FF 000C | CR 000D | SO 000E | SI 000F |
1_ | DLE 0010 | DC1 0011 | DC2 0012 | DC3 0013 | DC4 0014 | NAK 0015 | SYN 0016 | ETB 0017 | PUEDE 0018 | EM 0019 | SUB 001A | ESC 001B | FS 001C | GS 001D | RS 001E | US 001F |
2_ | SP 0020 | |||||||||||||||
3_ | 0 0030 | 1 0031 | 2 0032 | 3 0033 | 4 0034 | 5 0035 | 6 0036 | 7 0037 | 8 0038 | 9 0039 | ⑆ 2446 | ⑇ 2447 | ⑈ 2448 | ⑉ 2449 | ||
4_ | ||||||||||||||||
5_ | ||||||||||||||||
6_ | ||||||||||||||||
7_ | DEL 007F |
Letra Número Puntuación Símbolo Otro Indefinido Redefinido en comparación con ASCII
Referencias
- ^ ISO / IEC JTC 1 / SC 2 (1983). Procesamiento de información: codificación de caracteres legibles por máquina (MICR y OCR) . ISO . ISO 2033: 1983.
- ^ a b ISO / TC97 / SC2 (1 de agosto de 1985). ISO-IR-91: Juego de caracteres gráficos japoneses OCR-A (PDF) . ITSCJ / IPSJ .
- ^ a b ISO / TC97 / SC2 (1 de agosto de 1985). ISO-IR-92: Conjunto de caracteres gráficos básicos japoneses OCR-B (PDF) . ITSCJ / IPSJ .
- ^ ISO / TC97 / SC2 (1 de agosto de 1985). ISO-IR-93: OCR-B japonés - Conjunto de caracteres gráficos adicionales (PDF) . ITSCJ / IPSJ .
- ^ a b c d ISO / TC97 / SC2 (1 de agosto de 1985). ISO-IR-94: Juego de caracteres gráficos japoneses básicos impresos a mano para OCR (PDF) . ITSCJ / IPSJ .
- ^ ISO / TC97 / SC2 (1 de agosto de 1985). ISO-IR-96: Juego de caracteres gráficos Katakana impresos a mano para OCR (PDF) . ITSCJ / IPSJ .
- ^ a b c ISO / TC97 / SC2 (1 de agosto de 1985). ISO-IR-95: Juego de caracteres gráficos impresos a mano adicionales japoneses para OCR (PDF) . ITSCJ / IPSJ .
- ^ Consorcio Unicode . "Controles C0 y latín básico" (PDF) . El estándar Unicode .
- ^ Consorcio Unicode . "Reconocimiento óptico de caracteres" (PDF) . El estándar Unicode .
- ^ ISO / TC97 / SC2 (1 de agosto de 1985). ISO-IR-98: un conjunto de 14 caracteres gráficos de la fuente E13B (PDF) . ITSCJ / IPSJ .
- ^ a b Flohr, Guido. "Rutinas de conversión para ISO_2033_1983" . libintl . Locale :: RecodeData :: ISO_2033_1983.
- ^ a b "Juegos de caracteres" . IANA.
enlaces externos
- ISO 2033 distribuido por ISO
- JIS X 9010 distribuido por AFNOR