Códigos de control C0 y C1


De Wikipedia, la enciclopedia libre
  (Redirigido desde el final del medio )
Saltar a navegación Saltar a búsqueda

El código de control C0 y C1 o los conjuntos de caracteres de control definen códigos de control para su uso en texto por sistemas informáticos que utilizan ASCII y derivados de ASCII. Los códigos representan información adicional sobre el texto, como la posición de un cursor, una instrucción para iniciar una nueva línea o un mensaje de que se ha recibido el texto.

Los códigos C0 son del rango 00 HEX –1F HEX y el conjunto C0 predeterminado se definió originalmente en ISO 646 ( ASCII ). Los códigos C1 son del rango 80 HEX –9F HEX y el conjunto C1 predeterminado se definió originalmente en ECMA-48 (armonizado posteriormente con ISO 6429). El sistema ISO / IEC 2022 de especificar caracteres de control y gráficos permite que otros conjuntos C0 y C1 estén disponibles para aplicaciones especializadas, pero rara vez se utilizan.

Controles C0

ASCII definió 32 caracteres de control, más uno adicional necesario para el carácter DEL todo-1 (necesario para perforar todos los agujeros en una cinta de papel y borrarlo).

Esta gran cantidad de códigos era deseable en ese momento, ya que los controles multibyte requerirían la implementación de una máquina de estado en el terminal, lo cual era muy difícil con los terminales electrónicos y mecánicos contemporáneos. Desde entonces, sólo algunos de los controles originales han mantenido su uso: el rango de "espacios en blanco" de BS, TAB, LF, VT, FF y CR; el código BEL; y ESC (pero, excepto en ISO-2022-JP , casi siempre como parte de un ESC, '[' representación CSI que inicia una secuencia de escape ANSI ). Otros no se utilizan o han adquirido significados diferentes, como que NUL es el terminador de cadena C.

Algunos protocolos de transmisión en serie como ANPA-1312 , Kermit y XMODEM hacen un uso extensivo de los caracteres de control SOH, STX, ETX, EOT, ACK, NAK y SYN con fines que se aproximan a sus definiciones originales.

Códigos de control ASCII básicos

Estos son los códigos de control ASCII estándar, originalmente definidos en ANSI X3.4 . Si utiliza el mecanismo de extensión ISO / IEC 2022 , se designan como el juego de caracteres de control C0 activo con la secuencia de octetos 0x1B 0x21 0x40( ESC ! @). [1]

Nombres de número de categoría

Varios de los códigos de control ASCII básicos se clasifican en unas pocas categorías y, a veces, se les dan nombres abreviados alternativos que consisten en esa categoría y un número: [1]

  • Controles de transmisión: [1] TC 1 (SOH), TC 2 (STX), TC 3 (ETX), TC 4 (EOT), TC 5 (ENQ), TC 6 (ACK), TC 7 (DLE), TC 8 (NAK), TC 9 (SYN), TC 10 (ETB).
  • Efectores de formato: [1] FE 0 (BS), FE 1 (HT), FE 2 (LF), FE 3 (VT), FE 4 (FF), FE 5 (CR).
  • Controles del dispositivo: [1] DC 1 , DC 2 , DC 3 , DC 4 .
  • Separadores de información: [1] IS 1 (EE. UU.), IS 2 (RS), IS 3 (GS), IS 4 (FS).
  • Bloqueo de turnos: [17] LS 0 (SI), LS 1 (SO).
  • Otros: NUL, BEL, CAN, EM, SUB, ESC.

ISO / IEC 2022 (ECMA-35) se refiere a los cambios de bloqueo C0 como LS0 y LS1 en entornos de 8 bits, y como SI y SO en entornos de 7 bits. [17]

La primera edición de 1963 de ASCII clasificó DLE como un control de dispositivo, en lugar de un control de transmisión, y le dio la abreviatura DC0 ("control de dispositivo reservado para escape de enlace de datos"). [18]

Los códigos efectores de formato (FE) definen y activan el formato (como los saltos de línea ) que afectan la forma en que se presentan y representan los caracteres gráficos, en lugar de controlar otras funciones de los dispositivos de hardware o tener otros efectos secundarios. Los efectores de formato C0 están permitidos en las secuencias ISO / IEC 6429 DCS , OSC , PM y APC . Los separadores de información y los efectores de formato C0 (menos BS ) son los únicos códigos de control C0 con semántica definida por el estándar Unicode, y la interpretación del resto de los controles C0 se deja a los protocolos de nivel superior. [19]

ISO / IEC 2022 (ECMA-35) requiere que si los conjuntos de códigos de control C0 incluyen los diez códigos de control de transmisión (TC) ASCII, deben estar codificados en sus ubicaciones ASCII. [20] También prohíbe que esos diez controles de transmisión se incluyan en un conjunto de códigos de control C1, [21] y prohíbe que los controles de transmisión además de esos diez se incluyan en un conjunto de control C0. [20]

Conjuntos de códigos de control C0 modificados

Aunque los conjuntos de códigos de control C0 generalmente conservan la mayoría de los códigos de control ASCII sin cambios, se registra un número que reemplaza ciertas funciones de control con alternativas. A continuación se muestra una selección de estos, excluidos los relacionados con Videotex .

Otros conjuntos de códigos de control C0

El teletexto define un conjunto de códigos de control completamente diferente . En formatos donde no se requiere compatibilidad con los códigos de control C0 de ECMA-48, estos códigos de control a veces se asignan de forma transparente al rango de códigos de control Unicode C0 (U + 0000 a U + 001F). [30]

Controles C1

Paralelamente al desarrollo de la edición de 1972 de la norma ISO 646 , que revisó la norma para introducir el concepto de versiones nacionales del código además del ASCII de origen estadounidense, también se estaba trabajando con el propósito de definir mecanismos de extensión para ASCII. aplicable a entornos de 7 y 8 bits, que se publicarían como ECMA-35 e ISO 2022 . [31]

Estos mecanismos se diseñaron para que cualquier código de 8 bits conforme se pudiera convertir en un código de 7 bits correspondiente, y viceversa . [32] En un entorno de 7 bits, el Shift Out ( SO control) iba a cambiar el significado de los 94 bytes a través (es decir, los códigos gráficos, excluyendo el espacio) para invocar caracteres de un conjunto alternativo, y el cambio en ( SI ) el control los volvería a cambiar. [33] En un entorno de 8 bits, en lugar de utilizar códigos de desplazamiento, el octavo bit se estableció en un byte que hace referencia al conjunto de caracteres gráficos adicionales. Esto significó que bytes a través0x210x7E0xA10xFEse utilizaron para los caracteres gráficos adicionales. Los caracteres de control C0, que no se veían afectados por el estado de desplazamiento de un código de 7 bits, debían representarse siempre en un código de 8 bits con el octavo bit sin establecer. [32] En consecuencia, los bytes no utilizados en el rango a 0x80través 0x9Fpodrían usarse para códigos de control adicionales, que en su lugar se representarían como a 0x1B 0x40través 0x1B 0x5F(a ESC @través ESC _) en un código de 7 bits. [32] Estos códigos de control adicionales se conocen como códigos de control C1 . Para mantener la compatibilidad con la representación de 7 bits, el comportamiento de los bytes 0xA0y 0xFFse dejó originalmente sin definir. [34]

El primer conjunto de códigos de control C1 que se registró para su uso con ISO 2022 fue DIN 31626 , [35] un conjunto especializado para uso bibliográfico que se registró en 1979. [36] El conjunto de uso general ISO / IEC 6429 se registró en 1983, [37] aunque la especificación ECMA-48 en la que se basó se publicó por primera vez en 1976. [38]

Las ediciones posteriores de las normas alteraron las disposiciones hasta cierto punto. Por ejemplo, una nueva revisión de ECMA-35 e ISO 2022 en 1985 introdujo el concepto de un conjunto de caracteres gráficos de 96 códigos. [39] En un código de 8 bits, esto permitió que se utilizara todo el rango de 0xA0a 0xFFpara caracteres gráficos. El uso de conjuntos de 96 códigos también significó que el significado de los bytes 0x20y 0x7Fen el código de 7 bits correspondiente podría diferir de "Espacio" y "Eliminar", a menos que el código estuviera en el estado Shift In. [40] No fue posible utilizar conjuntos de 96 códigos para el conjunto G0 (Shift In). [39]

De acuerdo con esta estructura de código ISO 2022 revisada de 8 bits, ISO 8859 define conjuntos de caracteres que se codificarán sobre 0xA0 – FF, en combinación con los caracteres gráficos ASCII sobre 0x20–7E, y reserva los bytes fuera de estos rangos para usarlos como códigos no gráficos por otras especificaciones como ISO 6429. [41] Unicode hereda sus primeros 256 puntos de código de ISO 8859-1, por lo que también incorpora un rango reservado para un conjunto de códigos de control C1, aunque en su mayoría deja su función por definir por protocolos de nivel superior, con ISO / IEC 6429 sugerido como predeterminado. [19]

Códigos de control C1 para uso general

Estos son los códigos de control extendido más comunes y se definen en ISO / IEC 6429 , ECMA -48 y JIS X 0211 (anteriormente JIS C 6323). [42] Si se utiliza el mecanismo de extensión ISO / IEC 2022 , se designan como el conjunto de caracteres de control C1 activo con la secuencia 0x1B 0x22 0x43( ESC " C). [37] Aunque Unicode no requiere un conjunto de códigos de control C1 particular, dejando que su interpretación sea especificada por protocolos de nivel superior, y solo especifica un comportamiento para U + 0085, sugiere interpretar los códigos de control C1 como se especifica en ISO / IEC 6429 en ausencia de uso para otros fines. [19]También se enumeran en la tabla a continuación tres códigos de control que se enumeran junto con los códigos ISO / IEC 6429 en RFC  1345 , pero que en realidad no están definidos por ISO / IEC 6429 ( PAD , HOP y SGC ). [5] [43]

A excepción de SS2 y SS3 en texto EUC-JP , y NEL en texto transcodificado de EBCDIC , las formas de 8 bits de estos códigos casi nunca se utilizan. CSI , DCS y OSC se utilizan para controlar terminales de texto y emuladores de terminal , pero casi siempre mediante sus representaciones de códigos de escape de 7 bits. Sus representaciones de un solo byte que cumplen con ISO / IEC 2022 no son válidas en UTF-8, y las codificaciones UTF-8 de sus puntos de código correspondientes tienen dos bytes de longitud como sus formas de código de escape (por ejemplo, CSI en U + 009B se codifica como los bytes 0xC2, 0x9B en UTF-8), por lo que no hay ninguna ventaja en usar ellos en lugar de la secuencia de escape de dos bytes equivalente. Cuando estos códigos aparecen en documentos modernos, páginas web, mensajes de correo electrónico, etc., generalmente están destinados a imprimir caracteres en esa posición en una codificación patentada como Windows-1252 o Mac OS Roman que usan los códigos C1 para proporcionar caracteres gráficos adicionales.

Los nombres oficiales en inglés de algunos códigos C1 se revisaron en la edición más reciente de la norma para códigos de control en general (ISO 6429: 1992 o ECMA-48: 1991) para que fueran neutrales con respecto a los caracteres gráficos utilizados con ellos, y no asumir que, como en la escritura latina, las líneas están escritas en una página de arriba a abajo y que los caracteres están escritos en una línea de izquierda a derecha. Las abreviaturas utilizadas no se cambiaron, ya que el estándar ya había especificado que permanecerían sin cambios cuando el estándar se traduzca a otros idiomas. Cuando se ha cambiado el nombre, el nombre original del que se derivó la abreviatura también se indica entre paréntesis en las tablas siguientes.

Códigos de control C1 para uso bibliográfico

El siguiente conjunto de códigos de control C1 alternativo se define para aplicaciones bibliográficas como los sistemas de bibliotecas . Se ocupa principalmente de la intercalación de cadenas y del marcado de campos bibliográficos. Ligeramente diferentes variantes se definen en la norma alemana DIN 31626 [36] (publicado en 1978 y desde entonces retirada) [50] y la ISO estándar ISO 6630 , [51] [52] el último de los cuales también ha sido adoptado en Alemania como DIN ISO 6630 . [53] En el cuadro que figura a continuación se indica dónde difieren, cuando proceda. MARC-8 utiliza la codificación de NSB yNSE de este conjunto, y agrega algunos efectores de formato adicionales en ubicaciones no utilizadas por la versión ISO; sin embargo, MARC 21 usa este conjunto de control solo en registros MARC-8, no en registros en formato Unicode. [15]

Si utiliza el mecanismo de extensión ISO / IEC 2022 , el conjunto DIN 31626 se designa como el conjunto de caracteres de control C1 activo con la secuencia 0x1B 0x22 0x45( ESC " E), [36] y el conjunto ISO 6630 / DIN ISO 6630 se designa con la secuencia 0x1B 0x22 0x42( ESC " B). [51] La expansión de 1985 del conjunto ISO 6630 también se puede especificar explícitamente utilizando la secuencia 0x1B 0x26 0x40 0x1B 0x22 0x42( ESC & @ ESC " B). [52]

Otros conjuntos de códigos de control C1

EBCDIC define 16 códigos de control adicionales, además de los presentes en ASCII. Cuando se asignan a Unicode o ISO 8859 , estos códigos se asignan a los caracteres de control C1 de una manera especificada por la Arquitectura de representación de datos de caracteres (CDRA) de IBM. [54] [55]

Aunque el mapeo predeterminado del control New Line (NL) corresponde al NEL ISO / IEC 6429 (0x85; aunque su mapeo a veces se intercambia con LF, siguiendo la convención de finalización de línea UNIX), [54] el resto de los códigos de control sí no corresponden a ISO / IEC 6429. Por ejemplo, el SPS de control EBCDIC (0x09, mapeado a 0x8D) y el PLU de control ECMA-48 (0x8C) se utilizan para comenzar un superíndice o finalizar un subíndice, pero no se mapean a uno otro. Por lo tanto, se puede considerar que EBCDIC con mapa ASCII extendido tiene su propio conjunto C1, aunque no está registrado en el registro ISO-IR para su uso con ISO / IEC 2022 . [35]

Varios conjuntos de códigos de control C1 especializados están registrados para su uso por varios formatos videotex . [35]

Unicode

Unicode reserva 65 puntos de código en la categoría general "Cc" (Control) para compatibilidad con ISO / IEC 2022 . Los códigos de control en esta categoría cubren U + 0000 — U + 001F (controles C0), U + 007F (borrar) y U + 0080 — U + 009F (controles C1). Unicode solo especifica la semántica para U + 0009 — U + 000D, U + 001C — U + 001F y U + 0085. El resto de los códigos de control son transparentes para Unicode y sus significados se dejan a los protocolos de nivel superior. [19]

Unicode no tiene puntos de código de categoría "Cc" asignados distintos de los C0 y C1. Sin embargo, incluye caracteres efectores de formato adicionales además de los de los conjuntos de control C0 y C1, como marcas, incrustaciones, aislamientos y estallidos para formateo bidireccional explícito, y el ensamblador y no ensamblador de ancho cero para controlar el uso de ligaduras. Se les asigna la categoría general "Cf" (Formato) en lugar de "Cc".

Ver también

  • Imágenes de control
  • Código de escape ANSI

Notas al pie

  1. ^ El nombre BELL es asignado por Unicode alcarácter emoji no relacionado🔔 (U + 1F514). Si bien los caracteres de control C0 y C1 no fueron nombrados formalmente por el propio estándar Unicode en ese momento, esto chocó con el uso existente de BELL como el nombre de este carácter de control en el software siguiendo las versiones anteriores de UTS # 18 (el estándar Unicode Regular Expressions) , [4] por ejemplo, en Perl . [5] Unicode ahora acepta ALERT y BEL (pero no BELL) como alias formales para el carácter de control, [6] aunque la tabla de códigos todavía enumera BELL como el alias ISO 6429, [7] y el punto de código de imagen de control correspondientese llama SÍMBOLO DE CAMPANA. Posteriormente, Perl cambió a usar BELL para el emoji en la versión 5.18. [8]
  2. ^ La\esecuencia de escape'' no forma parte de ISO C ni de muchas otras especificaciones de idioma. Sin embargo, varios compiladores lo entienden, incluido GCC .
  3. ^ No es lo mismo que el comando del sistema operativo (OSC) en el conjunto de códigos ISO / IEC 6429 C1.
  4. ^ Deletreada "Syllabication [ sic ]" en el documento ISO-IR-040, junto con "syllabe" deletreada "syllabe [ sic ]" en la descripción. Se presume que se trata de errores tipográficos.

Referencias

  1. ^ a b c d e f g ISO / TC 97 / SC 2 (1975). El conjunto de caracteres de control de la ISO 646 (PDF) . ITSCJ / IPSJ . ISO-IR-1.
  2. ^ a b c d e f g h i j k IPTC (1995). El formato de mensaje recomendado por IPTC (PDF) (5ª ed.). IPTC TEC 7901.
  3. ^ a b c d "carácter de fin de transmisión (EOT)" . Estándar federal 1037C . 1996.
  4. ^ Williamson, Karl. "Re: PRI # 202: Extensiones de NameAliases.txt para Unicode 6.1.0" .
  5. ↑ a b c d e Ken Whistler (20 de julio de 2011). "Alias ​​de nombres formales para caracteres de control, L2 / 11-281" . Consorcio Unicode .
  6. ^ a b c d "Alias ​​de nombres" . Base de datos de caracteres Unicode . Consorcio Unicode .
  7. ^ "Controles C0 y latín básico" (PDF) . Consorcio Unicode.
  8. ^ "nombres de caracteres" . Documentación de programación de Perl .
  9. ^ ISO / IEC JTC 1 / SC 2 ( 12 de febrero de 1998). Texto final de DIS 8859-10, Tecnología de la información - Conjuntos de caracteres gráficos codificados de un solo byte de 8 bits - Parte 10: Alfabeto latino No. 6 (PDF) . ISO / IEC FDIS 8859-10: 1998, JTC1 / SC2 N2992, WG3 N415.
  10. ^ "carácter de escape de enlace de datos (DLE)" . Estándar federal 1037C . 1996.
  11. ^ "Funciones de control de transmisión suplementarias (una extensión de los procedimientos de control de modo básico para sistemas de comunicación de datos)" . Asociación europea de fabricantes de ordenadores . 1972. ECMA-37.
  12. ^ Lobo, Misha; Whistler, Ken; Wicksteed, Charles; Davis, Mark; Freytag, Asmus; Scherer, Markus (6 de mayo de 2005). "10.1 Evitar valores de bytes de control" . Un esquema de compresión estándar para Unicode . Consorcio Unicode . UTS # 6.
  13. ^ "¿Cuál es el punto de Ctrl-S?" . Intercambio de pilas Unix y Linux . Consultado el 14 de febrero de 2019 .
  14. ^ Fox, Brian . "Añadiendo un nuevo nodo a Info" . Información: El sistema de documentación GNU en línea, controlado por menús . Proyecto GNU .
  15. ^ a b c d e f g "Códigos de función de control" . Especificaciones MARC 21 para estructura de registros, juegos de caracteres y medios de intercambio . Biblioteca del Congreso . 2007-12-04.
  16. ^ "Tipos incorporados § str.splitlines" . La biblioteca estándar de Python . Fundación de software Python .
  17. ↑ a b ECMA (1994). "7.3: Invocación de elementos de código de juego de caracteres". Estructura del código de caracteres y técnicas de extensión (PDF) (Estándar ECMA) (6ª ed.). pag. 14. ECMA-35.
  18. ^ Asociación americana de estándares (1963). Código estándar americano para el intercambio de información: 4. Leyenda . pag. 6. ASA X3.4-1963.
  19. ^ a b c d Consorcio Unicode (2019). 23.1: Códigos de control (PDF) . El estándar Unicode (12.0.0 ed.). págs. 868–870. ISBN  978-1-936213-22-1.
  20. ↑ a b ECMA (1994). "6.4.2: Conjuntos primarios de funciones de control codificadas". Estructura del código de caracteres y técnicas de extensión (PDF) (Estándar ECMA) (6ª ed.). pag. 11. ECMA-35.
  21. ^ ECMA (1994). "6.4.3: Conjuntos suplementarios de funciones de control codificadas". Estructura del código de caracteres y técnicas de extensión (PDF) (Estándar ECMA) (6ª ed.). pag. 11. ECMA-35.
  22. ^ a b c d e f g h i j k l m Sveriges Standardiseringskommission (1975). Conjunto de control NATS para transmisión de texto de periódicos (PDF) . ITSCJ / IPSJ . ISO-IR-7.
  23. ^ a b c d e f g h i j k l m n IPTC (1976). Conjunto de control para la transmisión de textos de periódicos (PDF) . ITSCJ / IPSJ . ISO-IR-26.
  24. ^ a b UIT (1985). Conjunto primario de funciones de control Teletex (PDF) . ITSCJ / IPSJ . ISO-IR-106.
  25. Úřad pro normalizaci a měřeni (1987). El conjunto de caracteres de control de ISO 646, con EM reemplazado por SS2 (PDF) . ITSCJ / IPSJ . ISO-IR-140.
  26. ^ ISO / TC 97 / SC 2 (1977). El conjunto de caracteres de control de ISO 646, con IS4 reemplazado por Single Shift para G2 (SS2) (PDF) . ITSCJ / IPSJ . ISO-IR-36.
  27. ^ ISO / TC 97 / SC 2 (1982). El conjunto C0 de caracteres de control del estándar japonés JIS C 6225-1979 (PDF) . ITSCJ / IPSJ . ISO-IR-74.
  28. ^ a b ISO / TC97 / SC2 / WG6 . "Declaración de enlace con ISO / TC97 / SC2 / WG8 e ISO / TC97 / SC18 / WG8" (PDF) . ISO / TC97 / SC2 / WG6 N317.rev.
  29. ^ Printronix (2012). Manual de referencia del programador de OKI® (PDF) . pag. 26.
  30. Ewell, Doug (16 de octubre de 2020). "Gráficos de mosaico separados por teletexto" . Archivo de lista de correo Unicode . Consorcio Unicode .
  31. ^ ECMA / TC 1 (1973). "Breve historia". Juego de caracteres codificados de entrada / salida de 7 bits (PDF) (4ª ed.). ECMA . ECMA-6: 1973.
  32. ↑ a b c ECMA / TC 1 (1971). "8.2: Correspondencia entre el código de 7 bits y un código de 8 bits". Ampliación del juego de caracteres codificados de 7 bits (PDF) (1ª ed.). ECMA . págs. 21-24. ECMA-35: 1971.
  33. ^ ECMA / TC 1 (1973). "4.2: Caracteres de control específicos". Juego de caracteres codificados de entrada / salida de 7 bits (PDF) (4ª ed.). ECMA . pag. 16. ECMA-6: 1973.
  34. ^ ECMA / TC 1 (1974). "5: Notas sobre la tabla 1". Juego de caracteres codificados de 8 bits (PDF) (1ª ed.). ECMA . págs. 4-5. ECMA-43: 1974.
  35. ^ Un b c ISO / IEC Registro Internacional de juegos de caracteres codificados para ser utilizado con las secuencias de escape (PDF) , ITSCJ / IPSJ , ISO-IR
  36. ↑ a b c d DIN (15 de julio de 1979). Códigos de control adicionales para uso bibliográfico según la norma alemana DIN 31626 (PDF) . ITSCJ / IPSJ . ISO-IR-40.
  37. ↑ a b c d e f ISO / TC97 / SC2 (1 de octubre de 1983 ). Conjunto de control C1 de ISO 6429: 1983 (PDF) . ITSCJ / IPSJ . ISO-IR-77.
  38. ^ ECMA / TC 1 (1979). "Breve historia". Funciones de control adicionales para dispositivos de E / S de imágenes de caracteres (PDF) (2ª ed.). ECMA . ECMA-48: 1979.
  39. ↑ a b ECMA / TC 1 (1985). "5.3.8: Conjuntos de 96 caracteres gráficos". Técnicas de extensión de código (PDF) (4ª ed.). ECMA . págs. 17-18. ECMA-35: 1985.
  40. ^ ECMA / TC 1 (1985). "5.2.1: Uso de funciones de bloqueo-cambio". Técnicas de extensión de código (PDF) (4ª ed.). ECMA . págs. 9-10. ECMA-35: 1985.
  41. ^ ISO / IEC JTC 1 / SC 2 / WG 3 ( 12 de febrero de 1998). Texto final de DIS 8859-1, conjuntos de caracteres gráficos codificados de un solo byte de 8 bits — Parte 1: Alfabeto latino n.º 1 (PDF) . ISO / IEC FDIS 8859-1: 1998; JTC1 / SC2 / N2988; WG3 / N411. Este conjunto de caracteres gráficos codificados puede considerarse como una versión de un código de 8 bits según ISO / IEC 2022 o ISO / IEC 4873 en el nivel 1. […] Las posiciones sombreadas en la tabla de códigos corresponden a combinaciones de bits que no representar personajes gráficos. Su uso está fuera del alcance de ISO / IEC 8859; se especifica en otras Normas Internacionales, por ejemplo ISO / IEC 6429.
  42. ^ "JIS X 02xx 符号" (en japonés).
  43. ↑ a b c d Ken Whistler (5 de octubre de 2015). "Por qué nada desaparece" . Lista de correo Unicode .
  44. ^ ECMA (1991). Funciones de control para juegos de caracteres codificados . Estándar ECMA-48.
  45. ^ Lunde, Ken (2008). Procesamiento de información CJKV: Computación china, japonesa, coreana y vietnamita . O'Reilly. pag. 244. ISBN 9780596800925.
  46. ^ Moy, Edward; Gildea, Stephen; Dickey, Thomas. "Funciones de control de dispositivos" . Secuencias de control de XTerm .
  47. ^ a b c d e "Tabla de códigos en latín extendido (ANSEL)" . Especificaciones MARC 21 para estructura de registros, juegos de caracteres y medios de intercambio . Biblioteca del Congreso . 2007-12-05.
  48. ^ Moy, Edward; Gildea, Stephen; Dickey, Thomas. "Comandos del sistema operativo" . Secuencias de control de XTerm .
  49. ^ Frank da Cruz; Christine Gianone (1997). Utilizando C-Kermit . Prensa digital. pag. 278. ISBN 978-1-55558-164-0.
  50. ^ "Procesamiento de información; caracteres de control bibliográfico" . Beuth: publicación de DIN. DIN 31626: 1978-12.
  51. ↑ a b c d e ISO / TC 46 (1 de junio de 1983). Códigos de control adicionales para uso bibliográfico de acuerdo con la Norma Internacional ISO 6630 (PDF) . ITSCJ / IPSJ . ISO-IR-67.
  52. ↑ a b c d e ISO / TC 46 (1 de febrero de 1986). Códigos de control adicionales para uso bibliográfico de acuerdo con la Norma Internacional ISO 6630 (PDF) . ITSCJ / IPSJ . ISO-IR-124.
  53. ^ "DIN ISO 6630 diciembre de 1997" . Tienda Online de Ediciones AFNOR .
  54. ↑ a b Umamaheswaran, VS (8 de noviembre de 1999). "3.3 Paso 2: Conversión de bytes" . UTF-EBCDIC . Consorcio Unicode . Informe técnico Unicode n. ° 16. Los 64 caracteres de control […], el carácter ASCII DELETE (U + 007F) […] se asignan respetando las convenciones EBCDIC, como se define en IBM Character Data Representation Architecture, CDRA, con una excepción: el emparejamiento de EBCDIC Line Feed y New Los caracteres de control de línea se intercambian de sus pares predeterminados de CDRA a los caracteres de control de salto de línea ISO / IEC 6429 (U + 000A) y de línea siguiente (U + 0085)
  55. Steele, Shawn (24 de abril de 1996). cp037_IBMUSCanada a tabla Unicode . Consorcio Microsoft / Unicode .
  • El estándar Unicode
    • Controles C0 y latín básico
    • Controles C1 y suplemento Latin-1
    • Imágenes de control
    • El estándar Unicode, versión 6.1.0, Capítulo 16: Áreas especiales y caracteres de formato
  • Glosario de ATIS Telecom 2007
  • De litteris regentibus C1 quaestiones septem o ¿Son legales los caracteres C1 en XHTML 1.0?
  • Preguntas frecuentes del W3C I18N: HTML, XHTML, XML y códigos de control
  • Registro internacional de juegos de caracteres codificados que se utilizarán con secuencias de escape
Obtenido de " https://en.wikipedia.org/w/index.php?title=C0_and_C1_control_codes&oldid=1046033252#EM "