De Wikipedia, la enciclopedia libre
  (Redirigido desde ISO 646 )
Saltar a navegación Saltar a búsqueda

ISO / IEC 646 es el nombre de un conjunto de normas ISO , descritas como Tecnología de la información - Conjunto de caracteres codificados ISO de 7 bits para el intercambio de información y desarrollado en cooperación con ASCII al menos desde 1964. [1] [2] Desde su primera edición en 1967 [3] ha especificado un código de caracteres de 7 bits del que se derivan varios estándares nacionales.

ISO / IEC 646 también fue ratificado por ECMA como ECMA-6 . La primera versión de ECMA-6 se publicó en 1965, [4] sobre la base del trabajo realizado por el Comité Técnico TC1 de la ECMA desde diciembre de 1960. [4]

Los caracteres del conjunto básico de caracteres ISO / IEC 646 son caracteres invariables . [5] Dado que esa parte de ISO / IEC 646, que es el conjunto de caracteres invariantes compartido por todos los países, especificó solo las letras utilizadas en el alfabeto latino básico de ISO , los países que usaban letras adicionales necesitaban crear variantes nacionales de ISO 646 para poder para usar sus escrituras nativas. Dado que la transmisión y el almacenamiento de códigos de 8 bits no eran estándar en ese momento, los caracteres nacionales tuvieron que ajustarse a las restricciones de 7 bits, lo que significa que algunos caracteres que aparecen en ASCII no aparecen en otras variantes nacionales de ISO 646. .

Historia [ editar ]

ASCII temprano ( ASA X3.4 : 1963)

ISO / IEC 646 y su predecesor ASCII ( ASA X3.4 ) respaldaron en gran medida la práctica existente con respecto a las codificaciones de caracteres en la industria de las telecomunicaciones .

US-ASCII o ISO 646: EE. UU.

Como ASCII no proporcionó una cantidad de caracteres necesarios para idiomas distintos del inglés, se hicieron varias variantes nacionales que sustituyeron algunos caracteres menos utilizados por otros necesarios. Debido a la incompatibilidad de las diversas variantes nacionales, se introdujo una Versión de referencia internacional (IRV) de ISO / IEC 646, en un intento de al menos restringir el conjunto reemplazado a los mismos caracteres en todas las variantes. La versión original (ISO 646 IRV) difería de ASCII solo en que el punto de código 0x24, el signo de dólar de ASCII ($) fue reemplazado por el símbolo de moneda internacional (¤). La versión final de 1991 del código ISO 646: 1991 también se conoce como ITU T.50 , Alfabeto de referencia internacional o IRA, anteriormenteAlfabeto internacional No. 5 (IA5). Este estándar permite a los usuarios ejercitar los 12 caracteres variables (es decir, dos caracteres gráficos alternativos y 10 caracteres definidos a nivel nacional). Entre estos ejercicios, ISO 646: 1991 IRV (Versión de referencia internacional) se define explícitamente y es idéntico a ASCII . [6]

La serie de normas ISO 8859 que rigen las codificaciones de caracteres de 8 bits reemplaza la norma internacional ISO 646 y sus variantes nacionales, proporcionando 96 caracteres adicionales con el bit adicional y evitando así cualquier sustitución de códigos ASCII. El estándar ISO 10646 , directamente relacionado con Unicode , reemplaza todos los conjuntos ISO 646 e ISO 8859 con un conjunto unificado de codificaciones de caracteres utilizando un valor mayor de 21 bits.

ISO 646: JP

Un legado de ISO / IEC 646 es visible en Windows, donde en muchas configuraciones regionales de Asia Oriental, el carácter de barra invertida utilizado en los nombres de archivo se representa como ¥ u otros caracteres como ₩ . A pesar de que un código diferente para ¥ estaba disponible incluso en la página de códigos 437 de la IBM PC original , y un código de doble byte separado para ¥ está disponible en Shift JIS (aunque esto a menudo usa mapeo alternativo ), mucho texto se creó con el código de barra invertida utilizado para ¥ (debido a que Shift_JIS se basa oficialmente en ISO 646: JP, aunque Microsoft lo asigna como ASCII) que incluso las fuentes modernas de Windows han considerado necesario representar el código de esa manera. Existe una situación similar con ₩ yEUC-KR . Otro legado es la existencia de trigrafos en el lenguaje de programación C .

Estándares publicados [ editar ]

  • ISO / R646-1967 [3]
  • ISO 646: 1972 [7]
  • ISO 646: 1983 [8]
  • ISO / IEC 646: 1991 [7] [9]
  • ECMA-6 (30 de abril de 1965), primera edición [4]
  • ECMA-6 (1967-06), segunda edición [3] [4]
  • ECMA-6 (1970-07), tercera edición [4] [10]
  • ECMA-6 (1973-08), cuarta edición [4] [10]
  • ECMA-6 (1984-12, 1985-03), quinta edición [4]
  • ECMA-6 (1991-12, 1997-08), sexta edición [7]

Diseño de página de códigos [ editar ]

La siguiente tabla muestra el conjunto de caracteres invariantes ISO / IEC 646. Cada carácter se muestra con el código hexadecimal de su equivalente Unicode . Los puntos de código nacional son grises con el carácter ASCII que se reemplaza. Un cuadro pesado indica un carácter que, en algunas regiones, podría combinarse con un carácter anterior como diacrítico utilizando el carácter de retroceso , lo que puede afectar la elección del glifo .

Además de las restricciones de conjuntos invariantes, 0x23 está restringido para ser # o £ y 0x24 está restringido para ser $ o ¤ en ECMA-6: 1991, equivalente a ISO 646: 1991. [11] Sin embargo, estas restricciones no son seguidas por todas las variantes nacionales. [12] [13]

  Letra  Número  Puntuación  Símbolo  Otro  Indefinido

Familias de codificación relacionadas [ editar ]

Conjunto de caracteres de reemplazo nacional [ editar ]

El juego de caracteres de reemplazo nacional ( NRCS ) es una familia de codificaciones de 7 bits introducida en 1983 por DEC con la serie VT200 de terminales de computadora. Está estrechamente relacionado con ISO 646, ya que se basa en un subconjunto invariante similar de ASCII, que se diferencia en retener $como invariante pero no _(aunque la mayoría de las variantes de NRCS retienen el _conjunto invariante de ISO 646 y, por lo tanto, cumplen con él). La mayoría de las variantes de NRCS están estrechamente relacionadas con las correspondientes variantes nacionales de ISO 646 cuando existen, con la excepción de la variante holandesa .

Teletexto del sistema mundial [ editar ]

El estándar europeo de telecomunicaciones ETS 300 706, "Especificación de teletexto mejorado", define conjuntos de códigos latinos, griegos, cirílicos, árabes y hebreos con varias variantes nacionales tanto para el latín como para el cirílico. [14] Al igual que NRCS e ISO 646, dentro de las variantes latinas, la familia de codificaciones conocida como el conjunto G0 se basa en un subconjunto invariante similar de ASCII, pero no retiene $ni _como invariante. A diferencia de NRCS, las variantes a menudo difieren considerablemente de las variantes nacionales correspondientes de ISO 646.

Descripciones y códigos de variantes [ editar ]

Variantes nacionales ISO 646 [ editar ]

Algunas variantes nacionales de ISO 646 son las siguientes:

Derivados nacionales [ editar ]

También existen algunos conjuntos de caracteres nacionales que se basan en ISO 646 pero no siguen estrictamente su conjunto invariante (ver también § Derivados para otros alfabetos ):

Caracteres de control [ editar ]

Todas las variantes enumeradas anteriormente son únicamente juegos de caracteres gráficos y se deben utilizar con un juego de caracteres de control C0 como el que se enumera en la siguiente tabla:

Conjuntos de caracteres complementarios asociados [ editar ]

La siguiente tabla enumera los conjuntos de caracteres gráficos complementarios definidos por el mismo estándar que las variantes específicas de ISO 646. Estos se seleccionarían utilizando un mecanismo como shift out o el super shift de NATS (single shift), [48] o configurando el octavo bit en entornos donde hubiera uno disponible:

Cuadro de comparación de variantes [ editar ]

Los detalles de los cambios para algunas de estas variantes se dan en la siguiente tabla. No se muestran las asignaciones de caracteres sin cambios en todas las variantes enumeradas (es decir, que siguen siendo las mismas que ASCII).

Para facilitar la comparación, las variantes detalladas incluyen variantes nacionales de ISO 646, la serie de conjuntos de caracteres de reemplazo nacional (NRCS) estrechamente relacionados de DEC que se utilizan en los terminales VT200 , la serie de codificación de teletexto del sistema mundial europeo relacionada definida en ETS 300706 y algunas otras estrechamente relacionadas codificaciones basadas en ISO 646. Las tablas de códigos individuales están vinculadas desde la segunda columna. Las celdas con fondo no blanco enfatizan las diferencias con US-ASCII (también el subconjunto latino básico de ISO / IEC 10646 y Unicode).

Se pueden usar varios caracteres como caracteres de combinación , cuando van precedidos o seguidos de un control C0 de retroceso . Esto se atestigua en las tablas de códigos para IRV, GB, FR1, CA y CA2, que señalan que se comportaría como diéresis , acento agudo , cedilla y circunflejo (en lugar de comillas , una coma y una punta de flecha hacia arriba ) cuando van precedidas o seguidas. por un retroceso. El carácter de tilde (~) se introdujo de manera similar como un diacrítico (˜). Este método de codificación se originó en la máquina de escribir / teletipo"',^era en la que el uso de retroceso sobresaltaría un glifo y podría considerarse obsoleto .

Más tarde, cuando los conjuntos de caracteres más amplios ganaron más aceptación, ISO 8859 , los conjuntos de caracteres específicos del proveedor y, finalmente, Unicode se convirtieron en los métodos preferidos para codificar la mayoría de estas variantes.

  1. ^ a b c Es un subconjunto de una de las versiones de referencia internacional de ISO 646, pero no incluye todos los caracteres que están presentes en el conjunto invariante. Incluido para comparar.
  2. ^ También teletexto del Reino Unido.
  3. ^ a b c d e f g h i j k l m n No se ajusta completamente al conjunto invariante, pero es una derivada estrechamente relacionada de ISO 646. Se incluye aquí para comparación.
  4. ^ a b c d e Variante ISO 646 idéntica a la variante NRCS.
  5. ^ También World System Teletext (DE)
  6. ^ También teletexto del sistema mundial (SE / FI / HU)
  7. ^ a b Los conjuntos de caracteres NATS (por ejemplo, NATS-SEFI [71] ) reemplazan @(0x40) y `(0x60) con "Unidad de espacio A" (UA) y "Unidad de espacio B" (UB). El espacio simple (0x20) amplía la justificación. UA y UB son para anchos fijos, UA debe tener al menos el mismo ancho que UB. RFC  1345 asigna UA y UB a los puntos de código ISO 10646 (UCS) U + E002 y U + E003, ambos en el Área de uso privado , respectivamente (aunque también enumera las asignaciones PUA para varios otros caracteres que ahora tienen puntos de código UCS). Unicode contiene una cantidad de caracteres de espacio que pueden corresponder aproximadamente.
  8. ^ La conformidad con el conjunto invariante de ISO 646 es cuestionable, pero es un derivado estrechamente relacionado de ISO 646. Incluido aquí para comparación.

Derivadas para otros alfabetos [ editar ]

Algunos juegos de caracteres de 7 bits para alfabetos no latinos se derivan del estándar ISO 646: estos no constituyen en sí mismos ISO 646 debido a que no siguen sus puntos de código invariantes (a menudo reemplazan las letras de al menos un caso), debido a que admiten diferencias alfabetos para los que el conjunto de puntos de código nacional proporciona un espacio de codificación insuficiente. Ejemplos incluyen:

  • Turcomano de 7 bits (ISO-IR-230). [86]
  • Griego de 7 bits.
    • En ELOT 927 (ISO-IR-088), [45] el alfabeto griego se asigna en orden alfabético (excepto el sigma final) a las posiciones 0x61–0x71 y 0x73–0x79, encima de las letras minúsculas latinas.
    • ISO-IR-018 [87] mapea el alfabeto griego sobre ambos casos de letras usando un esquema diferente (no en orden alfabético, pero tratando cuando sea posible de hacer coincidir letras griegas sobre letras romanas que correspondan en algún sentido), e ISO-IR-019 [88] mapea el alfabeto griego en mayúsculas sobre las letras latinas en minúsculas usando el mismo esquema que ISO-IR-018.
    • La mitad inferior de la codificación de caracteres de la fuente Symbol [89] usa su propio esquema para mapear letras griegas de ambos casos sobre las letras ASCII romanas, también tratando de mapear letras griegas sobre letras romanas que corresponden en algún sentido, pero tomando decisiones diferentes en este respeto (ver cuadro a continuación). También reemplaza los puntos de código invariantes 0x22 y 0x27 y cinco puntos de código nacional con símbolos matemáticos. Aunque no está diseñado para su uso en la composición tipográfica de la prosa griega, a veces se usa con ese propósito.
    • ISO-IR-027 [46] (detallado en el cuadro anterior en lugar de abajo) incluye el alfabeto latino sin cambios, pero agrega algunas letras mayúsculas griegas que no se pueden representar con homoglyphs latinos ; si bien se basa explícitamente en ISO 646, algunos de estos se asignan a puntos de código que son invariantes en ISO 646 (0x21, 0x3A y 0x3F) y, por lo tanto, no es una verdadera variante de ISO 646.
    • La codificación del teletexto del sistema mundial para el griego utiliza otro esquema de mapeo de las letras griegas en orden alfabético sobre las letras ASCII de ambos casos, incluyendo en particular varias letras con signos diacríticos. [90]
  • Cirílico de 7 bits
    • KOI-7 o KOI corto, usado para ruso . Los caracteres cirílicos se asignan a las posiciones 0x60–0x7E, encima de las letras minúsculas latinas, haciendo coincidir letras homólogas cuando sea posible (donde в se asigna a w, no v). Reemplazado por las variantes KOI-8 .
    • SRPSCII y MAKSCII , variantes cirílicas de YUSCII (la variante latina es YU / ISO-IR-141 en el cuadro anterior), utilizadas para serbio y macedonio respectivamente. En gran parte homóloga a la variante de América de YUSCII (siguiendo Serbio digraphia reglas ), a excepción de Љ (LJ), Њ (nj), Џ (DZ) y ѕ (dz), que corresponden a dígrafos en ortografía América-script , y se asignan sobre letras que no se utilizan en serbio o macedonio (q, w, x, y).
    • Los conjuntos G0 para las codificaciones del teletexto del sistema mundial para ruso / búlgaro [91] y ucraniano [92] utilizan conjuntos G0 similares a KOI-7 con algunas modificaciones. El conjunto G0 correspondiente para cirílico serbio [a] [93] utiliza un esquema basado en la codificación de teletexto para serbocroata y esloveno de escritura latina , a diferencia del YUSCII significativamente diferente.
  • Hebreo de 7 bits, SI 960 . El alfabeto hebreo se asigna a las posiciones 0x60–0x7A, encima de las letras latinas minúsculas (y acento grave para aleph). El hebreo de 7 bits siempre se almacenaba en orden visual. Este mapeo con el bit alto establecido, es decir, con las letras hebreas en 0xE0–0xFA, es ISO 8859-8 . La codificación del teletexto del sistema mundial para hebreo usa las mismas asignaciones de letras, pero usa BS_Viewdata como su codificación base (mientras que SI 960 usa US-ASCII) e incluye un signo de shekel en 0x7B.
  • Árabe de 7 bits, OMAPE 449 (ISO-IR-089). [94] El alfabeto árabe se asigna a las posiciones 0x41–0x5A y 0x60–0x6A, encima de las letras latinas mayúsculas y minúsculas.

A continuación se muestra una comparación de algunas de estas codificaciones. Solo se muestra un caso, excepto en los casos en los que los casos se asignan a letras diferentes. En tales casos, se muestra primero el mapeo con el código más pequeño. Se dan posibles transcripciones para algunas letras; donde se omite, se puede considerar que la letra corresponde a la romana sobre la que está mapeada.

Ver también [ editar ]

  • ISO / IEC 2022 Tecnología de la información: estructura de códigos de caracteres y técnicas de extensión
  • ISO / IEC 6937 (ANSI)
  • ISO / IEC JTC 1 / SC 2

Notas al pie [ editar ]

  1. ^ Un b Etiquetada "cirílico G0 Programar primario - Opción 1 - serbio / croata", pero incluye macedonias letras Ќ y Ѓ (pero no Ѕ ). Un subconjunto de letras romanas, principalmente aquellas sin homoglyphs en el conjunto G0, se incluyen en el conjunto G1 (15.6.7 Tabla 41), incluyendo S / sa 0x6B / 7B. El croata está escrito en alfabeto latino .

Referencias [ editar ]

  1. ^ Mullendore, Ralph Elvin (1964) [1963]. Ptak, John F. (ed.). "Sobre el desarrollo temprano de ASCII - La historia de ASCII" . JF Ptak Science Books (publicado en marzo de 2012). Archivado desde el original el 26 de mayo de 2016 . Consultado el 26 de mayo de 2016 .
  2. ^ Juegos de caracteres codificados de 6 y 7 bits para el intercambio de procesamiento de información (borrador), Organización Internacional de Normalización , julio de 1964 (NB. 21 páginas. Con carta de presentación para los miembros del X3.2 y Grupos de Tareas de Eric Clamons.)
  3. ↑ a b c Mackenzie, Charles E. (1980). Juegos de caracteres codificados, historia y desarrollo . Serie de programación de sistemas (1 ed.). Addison-Wesley Publishing Company, Inc. págs. 7, 9, 412. ISBN 0-201-14460-3. LCCN  77-90165 . Consultado el 22 de mayo de 2016 . [1]
  4. ^ a b c d e f g ECMA-6 estándar: Juego de caracteres codificados de 7 bits (PDF) (5.a ed.). Ginebra, Suiza: Asociación Europea de Fabricantes de Computadoras (Ecma). Marzo de 1985. Archivado (PDF) desde el original el 29 de mayo de 2016 . Consultado el 29 de mayo de 2016 . El Comité Técnico TC1 de ECMA se reunió por primera vez en diciembre de 1960 para preparar códigos estándar para propósitos de Entrada / Salida. El [30] de abril de 1965, la Norma ECMA-6 fue adoptada por la Asamblea General de la ECMA.
  5. ^ Bodfish, John; Wilson, Mark; Gregory, Stephen; Nye, Julie Blume. Bodfish, John (ed.). "Manejo de caracteres invariables" . Protocolo de intercambio de circulación NISO . Departamento de Educación de Colorado, EE.UU .: Comité Permanente de NCIP (NCIP-SC). Archivado desde el original el 24 de diciembre de 2013 . Consultado el 30 de mayo de 2016 .
  6. ^ Demchenko, Yuri (2000) [1997]. "Estandarización internacional de códigos de 7 bits, ISO 646" . TERENA. 4. Archivado desde el original el 17 de junio de 2016 . Consultado el 13 de agosto de 2012 .
  7. ^ a b c Estándar ECMA-6: Juego de caracteres codificados de 7 bits (PDF) (6.a ed.). Ginebra, Suiza: Asociación Europea de Fabricantes de Computadoras (Ecma). Agosto de 1997 [diciembre de 1991]. Archivado (PDF) desde el original el 29 de mayo de 2016 . Consultado el 29 de mayo de 2016 .
  8. ^ "Procesamiento de información - juego de caracteres codificados ISO de 7 bits para el intercambio de información" . 1983-07-01. ISO 646: 1983. Archivado desde el original el 30 de mayo de 2016 . Consultado el 30 de mayo de 2016 .
  9. ^ "Tecnología de la información - Juego de caracteres codificados ISO de 7 bits para el intercambio de información" (3ª ed.). 1991-12-16. ISO / IEC 646: 1991. Archivado desde el original el 30 de mayo de 2016 . Consultado el 30 de mayo de 2016 .
  10. ^ a b Estándar ECMA-6: Juego de caracteres codificados de entrada / salida de 7 bits (PDF) (4ª ed.). Ginebra, Suiza: Asociación Europea de Fabricantes de Computadoras (Ecma). Agosto de 1973. Archivado (PDF) desde el original el 29 de mayo de 2016 . Consultado el 29 de mayo de 2016 .
  11. ^ ECMA (1991). "Juego de caracteres codificados de 7 bits" (PDF) . ECMA-6.
  12. ↑ a b Norge Standardiseringforbund (1 de junio de 1982). Norma noruega NS 4551 versión 2 (PDF) . ITSCJ / IPSJ . ISO-IR -61.
  13. ↑ a b Asociación de Normalización de China (1 de junio de 1982). Juego de caracteres codificados de 7 bits para intercambio de información (PDF) . ITSCJ / IPSJ . ISO-IR -57.
  14. ^ a b c d e f g h i j k l "15.6.2 Subconjuntos de opciones nacionales latinas, Tabla 36", ETS 300 706: Especificación de teletexto mejorada (PDF) , Instituto Europeo de Normas de Telecomunicaciones ( ETSI ), p. 115
  15. ^ "Información de la página de códigos SBCS - CPGID: 01020 / Nombre: variante canadiense (francesa)" . Software de IBM: Globalización: Juegos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . 1. IBM . 1992-10-01. Archivado desde el original el 17 de junio de 2016 . Consultado el 17 de junio de 2016 .
  16. ^ a b c d e f g h i j k l m n o p q r s t "Guía de comparación de HP PCL / PJL Reference PCL 5" (PDF) (2 ed.). Hewlett-Packard Company, LP . Junio ​​de 2003. Número de pieza de HP 502-0378. Archivado desde el original (PDF) el 10 de agosto de 2016 . Consultado el 10 de agosto de 2016 .
  17. ^ a b c d e f g h i j k l m n o p q r s t u v w x y z aa ab ac ad ae af ag ah ai aj ak al am an ao ap Bemer, Robert William (1980) . "Capítulo 1: Dentro de ASCII". Software de uso general (PDF) . Lo mejor de la era de la interfaz. 2 . Portland, OR, EE.UU .: dilithium Press. págs. 1-50. ISBN 0-918398-37-1. LCCN  79-67462 . Archivado desde el original el 27 de agosto de 2016 . Consultado el 27 de agosto de 2016 ,de: Bemer, Robert William (mayo de 1978). "Dentro de ASCII - Parte I". Edad de la interfaz . Portland, OR, EE.UU .: dilithium Press. 3 (5): 96–102., Bemer, Robert William (junio de 1978). "Dentro de ASCII - Parte II". Edad de la interfaz . Portland, OR, EE.UU .: dilithium Press. 3 (6): 64–74., Bemer, Robert William (julio de 1978). "Dentro de ASCII - Parte III". Edad de la interfaz . Portland, OR, EE.UU .: dilithium Press. 3 (7): 80–87.
  18. ↑ a b Sveriges standardiseringskommission (1975). El principal conjunto gráfico de caracteres de NATS para la transmisión de texto de periódicos en Dinamarca y Noruega (PDF) . ITSCJ / IPSJ . ISO-IR -9-1.
  19. ^ "Información de la página de códigos SBCS - CPGID: 01011 / Nombre: 7-Bit Germany FR" Software de IBM: Globalización: Conjuntos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . 1. IBM . 1987-08-01. Archivado desde el original el 17 de junio de 2016 . Consultado el 17 de junio de 2016 .
  20. ^ a b c d e "Identificadores de página de códigos" . Red de desarrolladores de Microsoft . Microsoft . 2014. Archivado desde el original el 19 de junio de 2016 . Consultado el 19 de junio de 2016 .
  21. ^ a b c d e "Codificaciones Web - Internet Explorer - Codificaciones" . Wiki de WHATWG . 2012-10-23. Archivado desde el original el 20 de junio de 2016 . Consultado el 20 de junio de 2016 .
  22. ^ Foller, Antonin (2014) [2011]. "Codificación alemana (IA5) - juegos de caracteres de Windows" . WUtils.com: utilidad y ayuda web en línea . Software de Motobit. Archivado desde el original el 20 de junio de 2016 . Consultado el 20 de junio de 2016 .
  23. ^ Norma danesa DS 2089: Aplicación del conjunto de caracteres codificados ISO de 7 bits . Febrero de 1974. UDC 681.3: 003.62.
  24. Stroustrup, Bjarne (29 de marzo de 1994). Diseño y evolución de C ++ (1ª ed.). Compañía editorial de Addison-Wesley . ISBN 0-201-54330-3.
  25. ^ "Información de la página de códigos SBCS - CPGID: 01017 / Nombre: Dinamarca de 7 bits" . Software de IBM: Globalización: Juegos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . 1. IBM . 1987-08-01. Archivado desde el original el 17 de junio de 2016 . Consultado el 17 de junio de 2016 .
  26. ^ "Información de la página de códigos SBCS - CPGID: 01023 / Nombre: Variante de España" . Software de IBM: Globalización: Juegos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . 1. IBM . 1992-10-01. Archivado desde el original el 17 de junio de 2016 . Consultado el 17 de junio de 2016 .
  27. ^ "Información de la página de códigos SBCS - CPGID: 01014 / Nombre: España de 7 bits" . Software de IBM: Globalización: Juegos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . 1. IBM . 1987-10-01. Archivado desde el original el 17 de junio de 2016 . Consultado el 17 de junio de 2016 .
  28. ^ a b "Información de la página de códigos SBCS - CPGID: 01018 / Nombre: Finlandia / Suecia de 7 bits" . Software de IBM: Globalización: Juegos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . 1. IBM . 1987-08-01. Archivado desde el original el 17 de junio de 2016 . Consultado el 17 de junio de 2016 .
  29. ^ "Información de la página de códigos SBCS - CPGID: 01010 / Nombre: Francia de 7 bits" . Software de IBM: Globalización: Juegos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . 1. IBM . 1987-08-01. Archivado desde el original el 17 de junio de 2016 . Consultado el 17 de junio de 2016 .
  30. ^ "Información de la página de códigos SBCS - CPGID: 01104 / Nombre: Conjunto NRC francés" . Software de IBM: Globalización: Juegos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . 1. IBM . 1987-08-01. Archivado desde el original el 21 de junio de 2016 . Consultado el 21 de junio de 2016 .
  31. ^ "Información de la página de códigos SBCS - CPGID: 01013 / Nombre: Reino Unido de 7 bits" . Software de IBM: Globalización: Juegos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . 1. IBM . 1987-08-01. Archivado desde el original el 17 de junio de 2016 . Consultado el 17 de junio de 2016 .
  32. ^ a b ISO / TC 97 / SC 2 (1975). El conjunto gráfico de caracteres de la versión de referencia internacional de ISO 646 (PDF) . ITSCJ / IPSJ . ISO-IR -2.
  33. ^ "Información de la página de códigos SBCS - CPGID: 01009 / Nombre: ISO IRV" . Software de IBM: Globalización: Juegos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . 1. IBM . 1990-04-01. Archivado desde el original el 17 de junio de 2016 . Consultado el 17 de junio de 2016 .
  34. ^ Foller, Antonin (2014) [2011]. "Codificación de Europa occidental (IA5) - conjuntos de caracteres de Windows" . WUtils.com: utilidad y ayuda web en línea . Software de Motobit. Archivado desde el original el 20 de junio de 2016 . Consultado el 20 de junio de 2016 .
  35. ^ "Información de la página de códigos SBCS - CPGID: 01012 / Nombre: Italia de 7 bits" . Software de IBM: Globalización: Juegos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . 1. IBM . 1987-08-01. Archivado desde el original el 17 de junio de 2016 . Consultado el 17 de junio de 2016 .
  36. ^ "Información de la página de códigos SBCS - CPGID: 00895 / Nombre: Japón latino de 7 bits" . Software de IBM: Globalización: Juegos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . 1. IBM . 1986-10-01. Archivado desde el original el 18 de junio de 2016 . Consultado el 18 de junio de 2016 .
  37. ^ "Información de la página de códigos SBCS - CPGID: 01019 / Nombre: Países Bajos de 7 bits" . Software de IBM: Globalización: Juegos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . 1. IBM . 1987-08-01. Archivado desde el original el 17 de junio de 2016 . Consultado el 17 de junio de 2016 .
  38. ^ "Información de la página de códigos SBCS - CPGID: 01016 / Nombre: Noruega de 7 bits" . Software de IBM: Globalización: Juegos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . 1. IBM . 1987-08-01. Archivado desde el original el 17 de junio de 2016 . Consultado el 17 de junio de 2016 .
  39. ^ Foller, Antonin (2014) [2011]. "Codificación noruega (IA5) - juegos de caracteres de Windows" . WUtils.com: utilidad y ayuda web en línea . Software de Motobit. Archivado desde el original el 20 de junio de 2016 . Consultado el 20 de junio de 2016 .
  40. ^ "Información de la página de códigos SBCS - CPGID: 01015 / Nombre: Portugal de 7 bits" . Software de IBM: Globalización: Juegos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . 1. IBM . 1987-08-01. Archivado desde el original el 17 de junio de 2016 . Consultado el 17 de junio de 2016 .
  41. ^ Foller, Antonin (2014) [2011]. "Codificación sueca (IA5) - juegos de caracteres de Windows" . WUtils.com: utilidad y ayuda web en línea . Software de Motobit. Archivado desde el original el 20 de junio de 2016 . Consultado el 20 de junio de 2016 .
  42. ^ "Información de la página de códigos SBCS - CPGID: 00367 / Nombre: ASCII" . Software de IBM: Globalización: Juegos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . 1. IBM . 1978-01-01. Archivado desde el original el 17 de junio de 2016 . Consultado el 17 de junio de 2016 .
  43. ^ Foller, Antonin (2014) [2011]. "Codificación US-ASCII - Conjuntos de caracteres de Windows" . WUtils.com: utilidad y ayuda web en línea . Software de Motobit. Archivado desde el original el 20 de junio de 2016 . Consultado el 20 de junio de 2016 .
  44. ↑ a b BSI (1 de junio de 1981). Alfanuméricos para visualización de datos y transmisión de teletexto (PDF) . ITSCJ / IPSJ . ISO-IR -47.
  45. ↑ a b ELOT (1 de julio de 1984). Conjunto de caracteres griegos para el idioma griego (PDF) . ITSCJ / IPSJ . ISO-IR -88.
  46. ↑ a b c ECMA (1976). Conjunto gráfico mixto latín-griego (solo letras mayúsculas griegas) (PDF) . ITSCJ / IPSJ . ISO-IR -27.
  47. ^ "Información de la página de códigos SBCS - CPGID: 01021 / Nombre: Variante de Suiza" . Software de IBM: Globalización: Juegos de caracteres codificados y recursos relacionados: Páginas de códigos por CPGID: Identificadores de páginas de códigos . 1. IBM . 1992-10-01. Archivado desde el original el 17 de junio de 2016 . Consultado el 17 de junio de 2016 .
  48. ^ Sveriges standardiseringskommission (1975). Conjunto de control NATS para transmisión de texto de periódicos (PDF) . ITSCJ / IPSJ . ISO-IR -7.
  49. ^ ANSI (1975). Conjunto de caracteres gráficos ASCII (PDF) . ITSCJ / IPSJ . ISO-IR -6.
  50. ^ IBM (1990). "Página de códigos 01009" (PDF) . REGISTRO: Juegos de caracteres gráficos y páginas de códigos .
  51. Dansk Standardiseringsråd (21 de enero de 1993). Conjunto de caracteres básico ISO / IEC 646 (PDF) . ITSCJ / IPSJ . ISO-IR -170.
  52. ^ "15.6.1 Latin G0 Set", ETS 300 706: Especificación de teletexto mejorado (PDF) , Instituto Europeo de Normas de Telecomunicaciones ( ETSI ), p. 114
  53. ^ Agencia Internacional de Energía Atómica (15 de julio de 1981). Subconjunto ISO 646 para INIS (PDF) . ITSCJ / IPSJ . ISO-IR -49.
  54. ^ Unión Internacional de Telecomunicaciones (1 de agosto de 1985). Conjunto primario teletex de caracteres gráficos (PDF) . ITSCJ / IPSJ . ISO-IR -102.
  55. ^ Comité japonés de normas industriales (1975). El conjunto de caracteres gráficos japoneses romanos (PDF) . ITSCJ / IPSJ . ISO-IR -14.
  56. ^ ISO / TC 97 / SC 2 ( 1 de agosto de 1985). Juego de caracteres gráficos básicos japoneses OCR-B (PDF) . ITSCJ / IPSJ . ISO-IR -92.
  57. ↑ a b Lunde, Ken (2008). "3. Estándares de juego de caracteres (§ CJKV-Roman)". Procesamiento de información CJKV (2ª ed.). O'Reilly Media . págs. 91–92. ISBN 9780596514471.
  58. BSI (1 de diciembre de 1975). El conjunto de caracteres gráficos del código de datos de 7 bits del Reino Unido (PDF) . ITSCJ / IPSJ . ISO-IR -4.
  59. ^ IBM (1992). "Página de códigos 01101" (PDF) . REGISTRO: Juegos de caracteres gráficos y páginas de códigos .
  60. NSAI (7 de diciembre de 1999). Variante del juego de caracteres codificados ISO de 7 bits para el idioma gaélico irlandés (PDF) . ITSCJ / IPSJ . ISO-IR -207.
  61. AFNOR (1 de junio de 1983). Jeu de caractères graphiques français pour la langue français (PDF) . ITSCJ / IPSJ . ISO-IR -69.
  62. ^ AFNOR (1975). Conjunto de caracteres gráficos en francés para el idioma francés (PDF) . ITSCJ / IPSJ . ISO-IR -25.
  63. ^ Consejo de estándares de Canadá (1 de febrero de 1986). Conjunto de gráficos primarios alternativos Nr. 1 (PDF) . ITSCJ / IPSJ . ISO-IR -121.
  64. ^ Consejo de estándares de Canadá (1 de febrero de 1986). Conjunto de gráficos primarios alternativos Nr. 2 (PDF) . ITSCJ / IPSJ . ISO-IR -122.
  65. ^ IBM (1992). "Página de códigos 01021" (PDF) . REGISTRO: Juegos de caracteres gráficos y páginas de códigos .
  66. ^ DIN (1975). Versión de referencia en alemán del juego de caracteres codificados ISO de 7 bits (solo gráficos) para el idioma alemán según se define en la norma alemana DIN 66 003 – junio de 1974 (PDF) . ITSCJ / IPSJ . ISO-IR -21.
  67. ^ Sveriges Standardiseringskommission (1975). El conjunto de caracteres gráfico básico sueco (PDF) . ITSCJ / IPSJ . ISO-IR -10.
  68. ^ Sveriges Standardiseringskommission (1975). El conjunto gráfico sueco de caracteres para la escritura oficial de nombres (PDF) . ITSCJ / IPSJ . ISO-IR -11.
  69. ^ IBM (1992). "Página de códigos 01106" (PDF) . REGISTRO: Juegos de caracteres gráficos y páginas de códigos .
  70. ^ IBM (1992). "Página de códigos 01103" (PDF) . REGISTRO: Juegos de caracteres gráficos y páginas de códigos .
  71. ↑ a b Sveriges Standardiseringskommission (1975). El principal conjunto de caracteres gráficos de NATS para la transmisión de textos de periódicos en Finlandia y Suecia (PDF) . ITSCJ / IPSJ . ISO-IR -8-1.
  72. ^ IBM (1987). "Página de códigos 01017" (PDF) . REGISTRO: Juegos de caracteres gráficos y páginas de códigos .
  73. ^ IBM (1992). "Página de códigos 01105" (PDF) . REGISTRO: Juegos de caracteres gráficos y páginas de códigos .
  74. ^ IBM (1992). "Página de códigos 01107" (PDF) . REGISTRO: Juegos de caracteres gráficos y páginas de códigos .
  75. Norge Standardiseringforbund (1 de junio de 1982). Norma noruega NS 4551 - Versión 1 (PDF) . ITSCJ / IPSJ . ISO-IR -60.
  76. ^ ECMA (1976). Variante del conjunto de caracteres codificados ISO de 7 bits (solo gráficos) para el idioma español (PDF) . ITSCJ / IPSJ . ISO-IR -17.
  77. ECMA (1 de julio de 1984). Juego de caracteres gráficos para los idiomas españoles (PDF) . ITSCJ / IPSJ . ISO-IR -85.
  78. Úrad pro normalizaci a měřeni (1 de julio de 1989). Juego de caracteres gráficos de la República de Cuba (PDF) . ITSCJ / IPSJ . ISO-IR -151.
  79. ECMA (30 de diciembre de 1976). Juego de caracteres gráficos para el idioma portugués (PDF) . ITSCJ / IPSJ . ISO-IR -16.
  80. ECMA (1 de julio de 1984). Juego de caracteres gráficos para el idioma portugués (PDF) . ITSCJ / IPSJ . ISO-IR -84.
  81. ^ Institución federal de estandarización (1 de noviembre de 1987). Alfabeto latino serbocroata y esloveno (PDF) . ITSCJ / IPSJ . ISO-IR -141.
  82. ^ IBM (1987). "Página de códigos 01019" (PDF) . REGISTRO: Juegos de caracteres gráficos y páginas de códigos .
  83. ^ IBM (1992). "Página de códigos 01102" (PDF) . REGISTRO: Juegos de caracteres gráficos y páginas de códigos .
  84. ^ ECMA (1976). Variante del conjunto de caracteres codificados ISO de 7 bits (solo gráficos) para el idioma italiano (PDF) . ITSCJ / IPSJ . ISO-IR -15.
  85. ^ Oficina de Normalización de Hungría (1 de julio de 1984). Versión de referencia húngara de ISO 646 (HRV) (PDF) . ITSCJ / IPSJ . ISO-IR -86.
  86. Turkmenstandartlary (14 de septiembre de 2000). Alfabeto turcomano (PDF) . ITSCJ / IPSJ . ISO-IR -230.
  87. ↑ a b ECMA (1976). Conjunto gráfico griego (PDF) . ITSCJ / IPSJ . ISO-IR -18.
  88. ^ ECMA (1976). Conjunto gráfico combinado latín-griego (solo letras mayúsculas) (PDF) . ITSCJ / IPSJ . ISO-IR -19.
  89. ^ "Mapa (versión externa) del conjunto de caracteres de símbolo de Mac OS a Unicode 4.0 y posterior" .
  90. ^ "15.6.8: Conjunto griego G0", ETS 300 706: Especificación de teletexto mejorado (PDF) , Instituto Europeo de Normas de Telecomunicaciones ( ETSI ), p. 121
  91. ^ "15.6.5: Conjunto de G0 cirílico - Opción 2 - Ruso / Búlgaro", ETS 300 706: Especificación de teletexto mejorado (PDF) , Instituto Europeo de Normas de Telecomunicaciones ( ETSI ), p. 118
  92. ^ "15.6.6: Conjunto de G0 cirílico - Opción 3 - Ucraniano", ETS 300 706: Especificación de teletexto mejorado (PDF) , Instituto Europeo de Normas de Telecomunicaciones ( ETSI ), p. 119
  93. ^ "15.6.4: Conjunto de G0 cirílico - Opción 1 - Serbio / croata", ETS 300 706: Especificación de teletexto mejorado (PDF) , Instituto Europeo de Normas de Telecomunicaciones ( ETSI ), p. 117
  94. ^ OMAPE (1 de enero de 1985). Juego de caracteres árabes codificados de 7 bits para intercambio de información (PDF) . ITSCJ / IPSJ . ISO-IR -89.

Lectura adicional [ editar ]

  • Fischer, Eric, ed. (1975) [1972]. Documentos fuente sobre la historia de los códigos de caracteres, 1972–1975 (Compilación) . Consultado el 7 de junio de 2020. [2] (79 páginas) que incluye: Bemer, Robert William (1972). "una vista de la historia del juego de caracteres ISO". Honeywell Computer Journal . Phoenix, Arizona, EE.UU .: Honeywell Information Systems. 6 (4): 274–286, 287–291. (13 + 5 páginas) y muchos otros documentos y correspondencia.

Enlaces externos [ editar ]

  • Zeichensatz nach ISO 646 (ASCII) (en alemán)
  • Historia en el sitio web de GNU Aspell
  • Tablas de caracteres ISO646 Tablas de caracteres de Koichi Yasuoka (安岡 孝) (consulte las tablas de caracteres nacionales ISO646 y las tablas de caracteres cuasi-ISO646 )
  • Turkish Text Deasciifier una herramienta (basada en el análisis estadístico de pentagramas del idioma turco) que revierte un texto turco ASCII definido al determinar los diacríticos apropiados (pero ambiguos) que normalmente se necesitan en turco pero que faltan en el conjunto US-ASCII.