JIS X 0201

JIS X 0201 , un estándar industrial japonés desarrollado en 1969 (entonces llamado JIS C 6220 hasta la reforma de la categoría JIS), fue el primer conjunto de caracteres electrónicos japoneses en ser ampliamente utilizado. Es una codificación de 7 bits o una codificación de 8 bits, aunque la codificación de 8 bits es dominante para el uso moderno. El nombre completo de este estándar es conjuntos de caracteres codificados de 7 y 8 bits para el intercambio de información ( 7 ビット及び 8 ビットの情報交換用符号化文字集合).

JIS X 0201
Página de códigos JIS X 0201 de 8 bits
MIME / IANA	8 bits : `JIS_X0201` 7 bits romana : `JIS_C6220-1969-ro` 7 bits Kana :`JIS_C6220-1969-jp`
Alias	JIS C 6220 de 8 bits : csHalfWidth Katakana Roman : ISO646-JP , iso-ir-14 Kana : iso-ir-13, x0201-7
Idioma (s)	Japonés (soporte básico), inglés
Estándar	JIS X 0201: 1969
Clasificación	ISO 646 , ISO 646 ampliado
Precedido por	Código Wabun , JIS C 0803
Sucesor	Cambiar JIS
Otras codificaciones relacionadas	Código Hangul de N bytes
v t mi

Los primeros 96 códigos comprenden una variante ISO 646 , en su mayoría siguiendo ASCII con algunas diferencias, mientras que los segundos códigos de 96 caracteres representan los signos fonéticos katakana japoneses . Dado que la codificación no proporciona ninguna forma de expresar hiragana o kanji , solo es capaz de expresar japonés escrito simplificado. Sin embargo, es posible expresar, al menos fonéticamente, la gama completa de sonidos en el idioma. En la década de 1980, esto era aceptable para medios como terminales de computadora en modo texto, telegramas, recibos u otros datos manejados electrónicamente.

JIS X 0201 fue reemplazado por codificaciones posteriores como Shift JIS (que combina este estándar y JIS X 0208 ) y Unicode posterior .

Historia

El Comite Consultatif International Telephonique et Telegraphique (CCITT) introdujo el código del Alfabeto Telegráfico Internacional No 2 (ITA2) como estándar internacional, que era la codificación latina de 5 bits. La mayoría de los países tienen sus propios estándares nacionales basados en esto. En Japón, la Agencia de Ciencia y Tecnología Industrial (AIST) lo estandarizó como los códigos de caracteres de 6 bits de JIS C 0803-1961 ( Diseño de teclado y códigos para teleimpresores ), que se combinaban con caracteres katakana. Sin embargo, no cumplía con los requisitos de la industria porque el mapa de caracteres era pequeño y el diseño del código no era práctico. El AIST consideró una codificación de caracteres práctica para reemplazar varios códigos utilizados en Japón. ^[1]

En 1963, ISO presentó un borrador de ISO R 646 ( juegos de caracteres codificados de 6 y 7 bits para el intercambio de procesamiento de información ). AIST comprometió la conjunción de ISO R 646 y mapeo katakana a la Sociedad de Procesamiento de Información de Japón (IPSJ). IPSJ formó el comité de estandarización del código. El comité no adoptó la forma de 6 bits del borrador de ISO porque el conjunto de katakana no encajaba en su mapa de caracteres. El primer borrador de JIS mapeó pequeños caracteres katakana junto a cada uno de sus caracteres katakana normales. Se consideró conveniente para clasificar por orden de Gojūon . Algunos miembros del comité criticaron que complicaría la mecánica de los teclados que solo manejaban caracteres katakana normales. El último borrador asignó pequeños caracteres katakana a las posiciones 0xA7-0xAF. En 1966, el cuarto borrador de ISO especificó el símbolo de la moneda nacional en 0x24, y el comité JIS planeó mapear el signo del yen . La primera edición de ISO 646 se publicó en 1967. Especificaba el signo de dólar de ASCII 0x24 como carácter invariante, por lo que el comité JIS decidió reemplazar la barra invertida 0x5c de ASCII (uno de los caracteres variantes) con el signo de yen. Sin embargo, el CCITT introdujo el Alfabeto Internacional No.5 (IA5) en 1968, que establecía que no existía ningún requisito para el signo del dólar y que podía ser reemplazado por el signo de la moneda internacional (¤). ^[2] ISO 646 se revisó en 1973 para cumplir con IA5. ^[3]

JIS C 6220 ( Códigos para el intercambio de información , 情報交換用符号) se publicó en 1969. Su número se cambió a JIS X 0201 debido a la reforma de la categoría JIS en 1987, y el nombre se cambió a código de 7 y 8 bits. juegos de caracteres para el intercambio de información (7 ビット及び 8 ビットの情報交換用符号化文字集合) en la edición de 1990.

El conjunto de caracteres de JIS X 0201 se había utilizado ampliamente en Japón. El Sistema Nacional de Comunicación de Datos Bancarios (全国銀行データ通信システム), el sistema de transferencia de fondos más grande de Japón, se estableció en 1973. Los mensajes de transacciones entre bancos usaban un subconjunto de JIS X 0201. El sistema se había usado hasta 2018, y fue reemplazado por ZEDI (Sistema de intercambio electrónico de datos bancarios a nivel nacional, 全銀 EDI システム) que podía manejar caracteres hiragana y kanji. ^[4] En 1978, se desarrolló el conjunto de caracteres de 2 bytes JIS C 6226 ( JIS X 0208 ) para expresar los caracteres hiragana y kanji. Incluye caracteres katakana, pero sus códigos y diseño son diferentes de JIS X 0201. Los fabricantes de computadoras desarrollaron sus propias extensiones de JIS X 0208 para mantener la compatibilidad con JIS X 0201. En 1982, el esquema de codificación Microsoft Kanji (página de códigos 932 de MS-DOS ) y SJC26 de Digital Research (para CP / M-86 en japonés ) se desarrollaron para combinar la codificación de un solo byte JIS X 0201 y la codificación de doble byte JIS X 0208 sin desplazamiento ni desplazamiento de caracteres. ^[5] Fueron llamados Shift JIS , que se convirtió en el estándar industrial para computadoras personales.

Detalles de implementacion

Conjunto romano de 7 bits ( cambio hacia adentro )

Conjunto de Kana de 7 bits (cambio de salida)

La primera mitad (conjunto romano) de JIS X 0201 constituye una variante japonesa de ISO 646 , que asciende a ASCII con barra invertida (\) y tilde (~) reemplazada por yen (¥) y línea superior (‾), ^[6] mientras que la segunda la mitad (conjunto de Kana) consiste principalmente en katakana . Los caracteres de control se especifican en JIS X 0211 .

En el formato de 7 bits, el carácter de control de cambio de salida (0x0E) cambia al conjunto Kana y el cambio de entrada (0x0F) cambia al conjunto romano. ^[7]^[8] En el formato de 8 bits, que se muestra en la tabla siguiente, los bytes con el bit más significativo establecido (es decir, 0x80–0xFF) se utilizan para el conjunto Kana y los bytes sin establecer (es decir, 0x00–0x7F) son utilizado de otra manera.

Los nombres utilizados específicamente para el conjunto romano de 7 bits incluyen "JISCII", ^[9] "JIS Roman", ^[10] "ISO646-JP", ^[11]^[12] "JIS C6220-1969-ro", ^[12]^[11] "Japanese-Roman", ^[13] "Japan 7-Bit Latin", ^[14] e "ISO-IR-14", ^[11]^[12]^[8] mientras que los nombres utilizados específicamente para el 7-bit El conjunto de Kana incluye "ISO-IR-13", ^[7]^[11]^[12] "JIS C6220-1969-jp" ^[11]^[12] y "x0201-7". ^[11]^[12]

La sustitución del símbolo del yen por la barra invertida puede hacer que las rutas en computadoras DOS y Windows con soporte japonés se muestren de manera extraña, como "C: ¥ Archivos de programa ¥", por ejemplo. ^[15] Otro problema similar son los caracteres de control de cadenas literales del lenguaje de programación C , como .printf("Hello, world.¥n");

Diseño de página de códigos

La siguiente tabla es el juego de caracteres codificados de 8 bits original de JIS X 0201 (con el juego de kana indicado por bytes con el juego de bits alto). ^[dieciséis]

Forma de 8 bits de JIS X 0201-1997
	_0	_1	_2	_3	_4	_5	_6	_7	_8	_9	_A	_B	_C	_D	_MI	_F
0_ 0	C0 códigos 0000-001F
1_ 16	C0 códigos 0000-001F
2_ 32	SP 0020	! 0021	" 0022	# 0023	$ 0024	% 0025	& 0026	« 0027	( 0028	) 0029	* 002A	+ 002B	, 002C	- 002D	. 002E	/ 002F
3_ 48	0 0030	1 0031	2 0032	3 0033	4 0034	5 0035	6 0036	7 0037	8 0038	9 0039	: 003A	; 003B	< 003C	= 003D	> 003E	? 003F
4_ 64	@ 0040	A 0041	B 0042	C 0043	D 0044	E 0045	F 0046	G 0047	H 0048	Yo 0049	J 004A	K 004B	L 004C	M 004D	N 004E	O 004F
5_ 80	P 0050	Q 0051	R 0052	S 0053	T 0054	U 0055	V 0056	W 0057	X 0058	Y 0059	Z 005A	[ 005B	¥ 00A5	] 005D	^ 005E	_ 005F
6_ 96	` 0060	un 0061	b 0062	c 0063	d 0064	e 0065	f 0066	g 0067	h 0068	yo 0069	j 006A	k 006B	l 006C	m 006D	n 006E	o 006F
7_ 112	p 0070	q 0071	r 0072	s 0073	t 0074	u 0075	v 0076	w 0077	x 0078	y 0079	z 007A	{ 007B	\| 007C	} 007D	‾ 203E	DEL 007F
8_ 128	Códigos C1 o bloque vacío 0080-009F
9_ 144	Códigos C1 o bloque vacío 0080-009F
A_ 160		。 3002	「 300C	」 300D	、 3001	・ 30FB	ヲ 30F2	ァ 30A1	ィ 30A3	ゥ 30A5	ェ 30A7	ォ 30A9	ャ 30E3	ュ 30E5	ョ 30E7	ッ 30C3
B_ 176	ー 30FC	ア 30A2	イ 30A4	ウ 30A6	エ 30A8	オ 30AA	カ 30AB	キ 30AD	ク 30AF	ケ 30B1	コ 30B3	サ 30B5	シ 30B7	ス 30B9	セ 30BB	ソ 30BD
C_ 192	タ 30BF	チ 30C1	ツ 30C4	テ 30C6	ト 30C8	ナ 30CA	ニ 30CB	ヌ 30CC	ネ 30CD	ノ 30CE	ハ 30CF	ヒ 30D2	フ 30D5	ヘ 30D8	ホ 30DB	マ 30DE
D_ 208	ミ 30DF	ム 30E0	メ 30E1	モ 30E2	ヤ 30E4	ユ 30E6	ヨ 30E8	ラ 30E9	リ 30EA	ル 30EB	レ 30EC	ロ 30ED	ワ 30EF	ン 30F3	゛ 309B	゜ 309C
E_ 224
F_ 240

Letra Número Puntuación Símbolo Otro Indefinido

Como parte de Shift JIS

A continuación se muestra el mapeo utilizado para JIS X 0201 como parte de Shift JIS , ^[17]^[18] es decir, mostrando la forma de 8 bits de JIS X 0201 y mapeando los caracteres Katakana al bloque de formularios de ancho medio y ancho completo (que a su vez deriva su diseño de kana de medio ancho de JIS X 0201).

Conjunto de caracteres de un solo byte de Shift JIS
	_0	_1	_2	_3	_4	_5	_6	_7	_8	_9	_A	_B	_C	_D	_MI	_F
0_ 0
1_ 16
2_ 32	SP 0020	! 0021	" 0022	# 0023	$ 0024	% 0025	& 0026	« 0027	( 0028	) 0029	* 002A	+ 002B	, 002C	- 002D	. 002E	/ 002F
3_ 48	0 0030	1 0031	2 0032	3 0033	4 0034	5 0035	6 0036	7 0037	8 0038	9 0039	: 003A	; 003B	< 003C	= 003D	> 003E	? 003F
4_ 64	@ 0040	A 0041	B 0042	C 0043	D 0044	E 0045	F 0046	G 0047	H 0048	Yo 0049	J 004A	K 004B	L 004C	M 004D	N 004E	O 004F
5_ 80	P 0050	Q 0051	R 0052	S 0053	T 0054	U 0055	V 0056	W 0057	X 0058	Y 0059	Z 005A	[ 005B	¥ 00A5	] 005D	^ 005E	_ 005F
6_ 96	` 0060	un 0061	b 0062	c 0063	d 0064	e 0065	f 0066	g 0067	h 0068	yo 0069	j 006A	k 006B	l 006C	m 006D	n 006E	o 006F
7_ 112	p 0070	q 0071	r 0072	s 0073	t 0074	u 0075	v 0076	w 0077	x 0078	y 0079	z 007A	{ 007B	\| 007C	} 007D	‾ 203E
8_ 128
9_ 144
A_ 160		｡ FF61	｢ FF62	｣ FF63	､ FF64	･ FF65	ｦ FF66	ｧ FF67	ｨ FF68	ｩ FF69	ｪ FF6A	ｫ FF6B	ｬ FF6C	ｭ FF6D	ｮ FF6E	ｯ FF6F
B_ 176	ｰ FF70	ｱ FF71	ｲ FF72	ｳ FF73	ｴ FF74	ｵ FF75	ｶ FF76	ｷ FF77	ｸ FF78	ｹ FF79	ｺ FF7A	ｻ FF7B	ｼ FF7C	ｽ FF7D	ｾ FF7E	ｿ FF7F
C_ 192	ﾀ FF80	ﾁ FF81	ﾂ FF82	ﾃ FF83	ﾄ FF84	ﾅ FF85	ﾆ FF86	ﾇ FF87	ﾈ FF88	ﾉ FF89	ﾊ FF8A	ﾋ FF8B	ﾌ FF8C	ﾍ FF8D	ﾎ FF8E	ﾏ FF8F
D_ 208	ﾐ FF90	ﾑ FF91	ﾒ FF92	ﾓ FF93	ﾔ FF94	ﾕ FF95	ﾖ FF96	ﾗ FF97	ﾘ FF98	ﾙ FF99	ﾚ FF9A	ﾛ FF9B	ﾜ FF9C	ﾝ FF9D	ﾞ FF9E	ﾟ FF9F
E_ 224
F_ 240

Los glóbulos rojos indican los primeros bytes de caracteres Shift JIS de doble byte. ^[5]

Mapeo alternativo de katakana

El perfil básico ISO-2022-JP no permite el conjunto Kana de JIS X 0201, solo el conjunto Roman y JIS X 0208 (aunque la propia ISO 2022 / JIS X 0202 lo permite). En consecuencia, al convertir JIS X 0201 katakana (o kana Unicode de ancho medio , que utilizan el mismo diseño) a ISO-2022-JP, a menudo se utiliza el siguiente mapeo o transformación. ^[20] Esto permite convertir el kana a JIS X 0208.

En teoría, este mapeo es igualmente correcto, ya que JIS X 0201 en sí mismo no especifica el ancho de visualización, aunque en la práctica (y especialmente en entornos de doble espacio ) JIS X 0201 se usa para katakana de ancho medio.

Para facilitar la comparación con el gráfico anterior, la asignación se muestra a continuación sobre la codificación katakana JIS X 0201 y con el conjunto de bits alto.

Asignaciones compatibles con JIS X 0208 para katakana JIS X 0201 ^[21]
	_0	_1	_2	_3	_4	_5	_6	_7	_8	_9	_A	_B	_C	_D	_MI	_F
A_		。 3002	「 300C	」 300D	、 3001	・ 30FB	ヲ 30F2	ァ 30A1	ィ 30A3	ゥ 30A5	ェ 30A7	ォ 30A9	ャ 30E3	ュ 30E5	ョ 30E7	ッ 30C3
B_	ー 30FC	ア 30A2	イ 30A4	ウ 30A6	エ 30A8	オ 30AA	カ 30AB	キ 30AD	ク 30AF	ケ 30B1	コ 30B3	サ 30B5	シ 30B7	ス 30B9	セ 30BB	ソ 30BD
C_	タ 30BF	チ 30C1	ツ 30C4	テ 30C6	ト 30C8	ナ 30CA	ニ 30CB	ヌ 30CC	ネ 30CD	ノ 30CE	ハ 30CF	ヒ 30D2	フ 30D5	ヘ 30D8	ホ 30DB	マ 30DE
D_	ミ 30DF	ム 30E0	メ 30E1	モ 30E2	ヤ 30E4	ユ 30E6	ヨ 30E8	ラ 30E9	リ 30EA	ル 30EB	レ 30EC	ロ 30ED	ワ 30EF	ン 30F3	゛^[a] 309B	゜^[b] 309C
	_0	_1	_2	_3	_4	_5	_6	_7	_8	_9	_A	_B	_C	_D	_MI	_F

Variantes y ampliaciones

Cambiar JIS

Implementaciones de IBM

La página de códigos 897 esla implementación de IBM de la forma de 8 bits de JIS X 0201. Incluye varios caracteres gráficos adicionales en elárea de caracteres de control C0 , y los puntos de código en cuestión pueden usarse como caracteres de control o caracteres gráficos dependiendo de la contexto,^{[23] de} manera similar en concepto a OEM-US , pero con diferentes caracteres gráficos. Las filas C0 se muestran a continuación.

Página de códigos 897, filas 0x00 y 0x10 únicamente ^[28]
	_0	_1	_2	_3	_4	_5	_6	_7	_8	_9	_A	_B	_C	_D	_MI	_F
0_ 0	NUL 0000	╔ 2554	╗ 2557	╚ 255A	╝ 255D	║ 2551	═ 2550	￬ FFEC	BS 0008	￮ FFEE	LF 000A	〿 303F	FF 000C	CR 000D	￭ FFED	☼ 263C
1_ 16	╬ 256C	DC1 0011	↕ 2195	DC3 0013	▓ 2593	╩ 2569	╦ 2566	╣ 2563	PUEDE 0018	╠ 2560	° / FS 2591 / 001C	↵ 21B5	￪ / DEL FFEA / 007F	￨ FFE8	￫ FFEB	￩ FFE9

IBM también implementa el conjunto Roman de 7 bits de JIS X 0201 como página de códigos 895 ^[29] y el conjunto Kana de 7 bits como página de códigos 896 para su uso como conjuntos de códigos ISO 2022 o EUC-JP . La página de códigos 896, además de las asignaciones estándar JIS X 0201, define cinco asignaciones adicionales, que se muestran a continuación. ^[30] Aunque el CCSID 896 asociado no permite el uso de estos caracteres extendidos , ^[31] sí lo permite el CCSID 4992 alternativo. ^[32]

Página de códigos 896, fila 0x60 únicamente ^[30]
	_0	_1	_2	_3	_4	_5	_6	_7	_8	_9	_A	_B	_C	_D	_MI	_F
6_ 96	¢ 00A2	£ 00A3	¬ 00AC	\ 005C	~ 007E

La página de códigos 1041 de IBM es una versión extendida de la página de códigos 897, que codifica estos cinco caracteres extendidos ^{[33] de} IBM en ubicaciones alternativas que son compatibles con Shift JIS (respectivamente 0x80, 0xA0, 0xFD, 0xFE y 0xFF). ^[34]

La página de códigos 903 de IBM está codificada para su uso como componente de un solo byte de ciertas codificaciones de caracteres chinos simplificados . ^[35] A pesar de esto, sigue ISO 646-JP / la mitad romana de JIS X 0201, ya que reemplaza la barra invertida ASCII 0x5C (en lugar del signo de dólar ASCII 0x24 como en GB 1988 / ISO 646-CN ) con el yen / signo de yuan . También utiliza los mismos gráficos de sustitución de C0 que la página de códigos 897. ^[36] Está estrechamente relacionado conLa página de códigos 904 , que está codificada para su uso como componente de un solo byte de ciertas codificaciones de caracteres chinos tradicionales , ^[37]^[38] y usa los mismos gráficos de reemplazo C0, pero sigue ASCII . ^[39]

Otros

Juego de caracteres NEC PC-8001 (1979) como se muestra en la fuente de 8 × 8 píxeles
Variante NEC utilizada en la serie PC98 .
Variante de Hitachi utilizada en el HD44780 .

Notas al pie

^ Se asigna para corresponder al carácter JIS X 0208 (asignado a U + 309B), no a la normalización de compatibilidad (que sería U + 3099, la versión combinada). ^[22]
^ Se asigna para corresponder al carácter JIS X 0208 (asignado a U + 309C), no a la normalización de compatibilidad (que sería U + 309A, la versión combinada). ^[22]

Referencias

^ 行政管理庁 (Agencia de Gestión Administrativa) (1968).行政における電子計算機の共同利用関する調査研究報告書(en japonés). 行政事務機械化研究協会. págs. 108-113. OCLC 703804474 .
^ CCITT (1969). "Recomendación V.3: Alfabeto internacional núm. 5". Libro Blanco: Tomo VIII - CCITT (Mar del Plata, 1968) . Unión Internacional de Telecomunicaciones . págs. 11-19 . Consultado el 25 de julio de 2019 .
^ Yasuoka, Koichi; Yasuoka, Motoko (2006). "2.2 ASCII と ISO R 646 と JIS C 6220".文字符号の歴史(en japonés). 共立出版. págs. 89–112. ISBN 4-320-12102-3.
^ "経理部門の人材不足で悩む会社に朗報、金融 EDI「 ZEDI 」が 2018 年稼働へ" . Nikkei X-TECH . 2017-11-30 . Consultado el 24 de julio de 2019 .
^ a b 西田, 憲正 (19 de diciembre de 1983). "Unix 風の機能を持ち込んだ日本語 MS-DOS 2.0 の機能と内部構造".日経エレクトロニクス(en japonés). Nikkei McGraw-Hill : 165-190. ISSN 0385-1680 .
^ "3.1.1 Detalles de problemas" . Problemas y soluciones para Unicode y caracteres definidos por el usuario / proveedor . El Grupo Abierto de Japón. Archivado desde el original el 3 de febrero de 1999 . Consultado el 15 de abril de 2019 .
^ a b ISO-IR 013: El conjunto de caracteres gráficos japoneses KATAKANA (PDF) , Comisión de Normas de Tecnología de la Información de Japón (ITSCJ / IPSJ)
^ a b ISO-IR 014: El conjunto de caracteres gráficos romanos japoneses (PDF) , Comisión de Normas de Tecnología de la Información de Japón (ITSCJ / IPSJ)
^ "IBM-943 e IBM-932" , IBM Knowledge Center , IBM
^ "kUnicodeForceASCIIRangeMask" , Documentación para desarrolladores de Apple , Apple Inc
^ a b c d e f RFC 1345
^ a b c d e f "Juegos de caracteres" . IANA.
^ da Cruz, Frank (2010-04-02), "Nombres de conjuntos de caracteres de Kermit y MIME" , Proyecto Kermit , Universidad de Columbia
^ "CP 00895" , IBM Globalization - Identificadores de página de códigos , IBM
^ Kaplan, Michael S. (17 de septiembre de 2005). "¿Cuándo una barra invertida no es una barra invertida?" .
^ JIS X 0201-1997 (en japonés). Asociación Japonesa de Normas . 1997-02-28. pag. 17.
^ "ibm-943_P130-1999" . Demostración de UCI - Explorador de convertidores . Componentes internacionales para Unicode .
^ Apple, Inc (5 de abril de 2005) [15 de abril de 1995]. "JAPANESE.TXT: Mapa (versión externa) de la codificación japonesa de Mac OS a Unicode 2.1 y posterior" . Consorcio Unicode .
^ van Kesteren, Anne (11 de febrero de 2019). "12.2.2. Codificador ISO-2022-JP" . Estándar de codificación . WHATWG .
^ Elestándar de codificación WHATWG , por ejemplo, lo usa como una transformación al codificar datos kana de ancho medio Unicode a ISO-2022-JP. ^[19]
^ van Kesteren, Anne (6 de enero de 2018). "Índice ISO-2022-JP Katakana" . Estándar de codificación . WHATWG .
^ a b van Kesteren, Anne (11 de febrero de 2019). "5. Índices" . Estándar de codificación . WHATWG .
^ "Identificadores de página de códigos - CP 00897" . Globalización de IBM . IBM. Archivado desde el original el 17 de marzo de 2016.
^ "CP00897.pdf" (PDF) . IBM. Archivado (PDF) desde el original el 12 de enero de 2019 . Consultado el 5 de diciembre de 2017 .
^ "CP00897.txt" . IBM. Archivado desde el original el 12 de enero de 2019 . Consultado el 5 de diciembre de 2017 .
^ "Explorador de convertidores - ibm-943_P130-1999" . Demostración en UCI . Componentes internacionales para Unicode.
^ "Identificadores de juego de caracteres codificados - CCSID 943" . Globalización de IBM . IBM. Archivado desde el original el 15 de marzo de 2016.
^ Los gráficos se enumeran según CP00897.pdf y CP00897.txt proporcionados por IBM. ^[24]^{[25] Los} controles se enumeran, en ausencia de función gráfica o cuando difieren de ASCII, según el códec ibm-943_P130-1999 proporcionado por IBM a International Components para Unicode ^[26] (IBM-943 es una página de códigos 897 superconjunto). ^[27] SUB se asigna a 0x7F.
^ "CP00895.pdf" (PDF) . IBM. Archivado (PDF) desde el original el 8 de diciembre de 2017 . Consultado el 6 de diciembre de 2017 .
^ a b "CP00896.pdf" (PDF) . IBM. Archivado (PDF) desde el original el 12 de enero de 2019 . Consultado el 5 de diciembre de 2017 .
^ "Identificadores de juego de caracteres codificados - CCSID 896" . Globalización de IBM . IBM. Archivado desde el original el 26 de marzo de 2016.
^ "Identificadores de juego de caracteres codificados - CCSID 4992" . Globalización de IBM . IBM. Archivado desde el original el 27 de marzo de 2016.
^ "11.2 - Conjunto IBM Extended SBCS". Conjunto de caracteres gráficos japoneses de IBM para código UNIX extendido (EUC) (PDF) . IBM. pag. 315. Archivado (PDF) desde el original el 12 de enero de 2019 . Consultado el 7 de diciembre de 2017 .
^ "CP01041.pdf" (PDF) . IBM. Archivado (PDF) desde el original el 12 de enero de 2019 . Consultado el 5 de diciembre de 2017 .
^ "Identificadores de página de códigos - CP 903" . Globalización de IBM . IBM. Archivado desde el original el 17 de marzo de 2016.
^ "CP00903.pdf" (PDF) . IBM. Archivado (PDF) desde el original el 12 de enero de 2019 . Consultado el 17 de febrero de 2018 .
^ "Identificadores de página de códigos - CP 904" . Globalización de IBM . IBM.^{[ enlace muerto permanente ]}
^ "Identificadores de juego de caracteres codificados - CCSID 904" . Globalización de IBM . IBM. Archivado desde el original el 27 de marzo de 2016.
^ "CP00904.pdf" (PDF) . IBM. Archivado (PDF) desde el original el 12 de enero de 2019 . Consultado el 11 de mayo de 2018 .

enlaces externos

Diagrama de JIS X 0201 (como conjuntos de códigos de 7 bits)

[23] ^ Se asigna para corresponder al carácter JIS X 0208 (asignado a U + 309B), no a la normalización de compatibilidad (que sería U + 3099, la versión combinada). ^[22]

[24] ^ Se asigna para corresponder al carácter JIS X 0208 (asignado a U + 309C), no a la normalización de compatibilidad (que sería U + 309A, la versión combinada). ^[22]

[AMAJ_1968-1] 行政管理庁 (Agencia de Gestión Administrativa) (1968).行政における電子計算機の共同利用関する調査研究報告書(en japonés). 行政事務機械化研究協会. págs. 108-113. OCLC 703804474 .

[2] CCITT (1969). "Recomendación V.3: Alfabeto internacional núm. 5". Libro Blanco: Tomo VIII - CCITT (Mar del Plata, 1968) . Unión Internacional de Telecomunicaciones . págs. 11-19 . Consultado el 25 de julio de 2019 .

[3] Yasuoka, Koichi; Yasuoka, Motoko (2006). "2.2 ASCII と ISO R 646 と JIS C 6220".文字符号の歴史(en japonés). 共立出版. págs. 89–112. ISBN 4-320-12102-3.

[4] "経理部門の人材不足で悩む会社に朗報、金融 EDI「 ZEDI 」が 2018 年稼働へ" . Nikkei X-TECH . 2017-11-30 . Consultado el 24 de julio de 2019 .

[nishida_1983-5] 西田, 憲正 (19 de diciembre de 1983). "Unix 風の機能を持ち込んだ日本語 MS-DOS 2.0 の機能と内部構造".日経エレクトロニクス(en japonés). Nikkei McGraw-Hill : 165-190. ISSN 0385-1680 .

[6] "3.1.1 Detalles de problemas" . Problemas y soluciones para Unicode y caracteres definidos por el usuario / proveedor . El Grupo Abierto de Japón. Archivado desde el original el 3 de febrero de 1999 . Consultado el 15 de abril de 2019 .

[isoir013-7] ISO-IR 013: El conjunto de caracteres gráficos japoneses KATAKANA (PDF) , Comisión de Normas de Tecnología de la Información de Japón (ITSCJ / IPSJ)

[isoir014-8] ISO-IR 014: El conjunto de caracteres gráficos romanos japoneses (PDF) , Comisión de Normas de Tecnología de la Información de Japón (ITSCJ / IPSJ)

[9] "IBM-943 e IBM-932" , IBM Knowledge Center , IBM

[10] "kUnicodeForceASCIIRangeMask" , Documentación para desarrolladores de Apple , Apple Inc

[rfc1345-11] RFC 1345

[iana31j-12] "Juegos de caracteres" . IANA.

[13] Cruz, Frank (2010-04-02), "Nombres de conjuntos de caracteres de Kermit y MIME" , Proyecto Kermit , Universidad de Columbia

[ibm895-14] "CP 00895" , IBM Globalization - Identificadores de página de códigos , IBM

[15] Kaplan, Michael S. (17 de septiembre de 2005). "¿Cuándo una barra invertida no es una barra invertida?" .

[16] JIS X 0201-1997 (en japonés). Asociación Japonesa de Normas . 1997-02-28. pag. 17.

[17] "ibm-943_P130-1999" . Demostración de UCI - Explorador de convertidores . Componentes internacionales para Unicode .

[18] Apple, Inc (5 de abril de 2005) [15 de abril de 1995]. "JAPANESE.TXT: Mapa (versión externa) de la codificación japonesa de Mac OS a Unicode 2.1 y posterior" . Consorcio Unicode .

[19] van Kesteren, Anne (11 de febrero de 2019). "12.2.2. Codificador ISO-2022-JP" . Estándar de codificación . WHATWG .

[20] Elestándar de codificación WHATWG , por ejemplo, lo usa como una transformación al codificar datos kana de ancho medio Unicode a ISO-2022-JP. ^[19]

[index-iso-2022-jp-katakana-txt-21] van Kesteren, Anne (6 de enero de 2018). "Índice ISO-2022-JP Katakana" . Estándar de codificación . WHATWG .

[indexes-22] van Kesteren, Anne (11 de febrero de 2019). "5. Índices" . Estándar de codificación . WHATWG .

[cpgid897-25] "Identificadores de página de códigos - CP 00897" . Globalización de IBM . IBM. Archivado desde el original el 17 de marzo de 2016.

[cpgid897pdf-26] "CP00897.pdf" (PDF) . IBM. Archivado (PDF) desde el original el 12 de enero de 2019 . Consultado el 5 de diciembre de 2017 .

[cpgid897txt-27] "CP00897.txt" . IBM. Archivado desde el original el 12 de enero de 2019 . Consultado el 5 de diciembre de 2017 .

[28] "Explorador de convertidores - ibm-943_P130-1999" . Demostración en UCI . Componentes internacionales para Unicode.

[ccsid943-29] "Identificadores de juego de caracteres codificados - CCSID 943" . Globalización de IBM . IBM. Archivado desde el original el 15 de marzo de 2016.

[30] ^ Los gráficos se enumeran según CP00897.pdf y CP00897.txt proporcionados por IBM. ^[24]^{[25] Los} controles se enumeran, en ausencia de función gráfica o cuando difieren de ASCII, según el códec ibm-943_P130-1999 proporcionado por IBM a International Components para Unicode ^[26] (IBM-943 es una página de códigos 897 superconjunto). ^[27] SUB se asigna a 0x7F.

[cpgid895pdf-31] "CP00895.pdf" (PDF) . IBM. Archivado (PDF) desde el original el 8 de diciembre de 2017 . Consultado el 6 de diciembre de 2017 .

[cpgid896pdf-32] "CP00896.pdf" (PDF) . IBM. Archivado (PDF) desde el original el 12 de enero de 2019 . Consultado el 5 de diciembre de 2017 .

[33] "Identificadores de juego de caracteres codificados - CCSID 896" . Globalización de IBM . IBM. Archivado desde el original el 26 de marzo de 2016.

[34] "Identificadores de juego de caracteres codificados - CCSID 4992" . Globalización de IBM . IBM. Archivado desde el original el 27 de marzo de 2016.

[extsbcs-35] "11.2 - Conjunto IBM Extended SBCS". Conjunto de caracteres gráficos japoneses de IBM para código UNIX extendido (EUC) (PDF) . IBM. pag. 315. Archivado (PDF) desde el original el 12 de enero de 2019 . Consultado el 7 de diciembre de 2017 .

[cpgid1041pdf-36] "CP01041.pdf" (PDF) . IBM. Archivado (PDF) desde el original el 12 de enero de 2019 . Consultado el 5 de diciembre de 2017 .

[37] "Identificadores de página de códigos - CP 903" . Globalización de IBM . IBM. Archivado desde el original el 17 de marzo de 2016.

[cpgid903pdf-38] "CP00903.pdf" (PDF) . IBM. Archivado (PDF) desde el original el 12 de enero de 2019 . Consultado el 17 de febrero de 2018 .

[39] "Identificadores de página de códigos - CP 904" . Globalización de IBM . IBM.^{[ enlace muerto permanente ]}

[40] "Identificadores de juego de caracteres codificados - CCSID 904" . Globalización de IBM . IBM. Archivado desde el original el 27 de marzo de 2016.

[cpgid904pdf-41] "CP00904.pdf" (PDF) . IBM. Archivado (PDF) desde el original el 12 de enero de 2019 . Consultado el 11 de mayo de 2018 .

[1]