Codificación de corcho

La codificación Cork (también conocida como T1 o EC ) es una codificación de caracteres utilizada para codificar glifos en fuentes . ^[1] Lleva el nombre de la ciudad de Cork en Irlanda , donde durante una conferencia de TeX Users Group (TUG) en 1990 se introdujo una nueva codificación para LaTeX . ^[1] Contiene 256 caracteres que admiten la mayoría de los idiomas de Europa occidental y oriental con el alfabeto latino . ^[2]

Detalles

En los motores TeX de 8 bits , la codificación de la fuente debe coincidir con la codificación de los patrones de separación de sílabas donde esta codificación se usa con más frecuencia. ^[3] En LaTeX uno puede cambiar a esta codificación con \usepackage[T1]{fontenc}, mientras que en ConTeXt MkII esta ya es la codificación predeterminada. En motores modernos como XeTeX y LuaTeX, Unicode es totalmente compatible y las codificaciones de fuentes de 8 bits están obsoletas.

Conjunto de caracteres

Codificación de corcho
	_0	_1	_2	_3	_4	_5	_6	_7	_8	_9	_A	_B	_C	_D	_MI	_F
0_ 0	` 0060	´ 00B4	02C6	˜ 02DC	¨ 00A8	˝ 02DD	˚ 02DA	02C7	˘ 02D8	¯ 00AF	˙ 02D9	¸ 00B8	˛ 02DB	‚ 201A	‹ 2039	› 203A
1_ 16	“ 201C	" 201D	„ 201E	« 00AB	» 00BB	- 2013	- 2014	ZWSP 200B	₀ ^[a] 2080	ı ^[b] 0131	ȷ ^[b] 0237	ﬀ FB00	ﬁ FB01	fl FB02	ﬃ FB03	ﬄ FB04
2_ 32	0020	! 0021	" 0022	# 0023	$ 0024	% 0025	& 0026	' 2019	( 0028	) 0029	* 002A	+ 002B	, 002C	- 002D	. 002E	/ 002F
3_ 48	0 0030	1 0031	2 0032	3 0033	4 0034	5 0035	6 0036	7 0037	8 0038	9 0039	: 003A	; 003B	< 003C	= 003D	> 003E	? 003F
4_ 64	@ 0040	A 0041	B 0042	C 0043	D 0044	E 0045	F 0046	G 0047	H 0048	Yo 0049	J 004A	K 004B	L 004C	M 004D	N 004E	O 004F
5_ 80	P 0050	Q 0051	R 0052	S 0053	T 0054	U 0055	V 0056	W 0057	X 0058	Y 0059	Z 005A	[ 005B	\ 005C	] 005D	^ 005E	_ 005F
6_ 96	' 2018	un 0061	b 0062	c 0063	d 0064	e 0065	f 0066	g 0067	h 0068	yo 0069	j 006A	k 006B	l 006C	m 006D	n 006E	o 006F
7_ 112	p 0070	q 0071	r 0072	s 0073	t 0074	u 0075	v 0076	w 0077	x 0078	y 0079	z 007A	{ 007B	\| 007C	} 007D	~ 007E	TÍMIDO^[c] 00AD
8_ 128	Ă 0102	Ą 0104	Ć 0106	Č 010C	Ď 010E	Ì 011A	Ę 0118	Ğ 011E	Ĺ 0139	Ľ 013D	Ł 0141	Ń 0143	Ň 0147	Ŋ 014A	Ő 0150	Ŕ 0154
9_ 144	Ř 0158	Ś 015A	Š 0160	Ş 015E	Ť 0164	Ţ 0162	Ű 0170	Ů 016E	Ÿ 0178	Ź 0179	Ž 017D	Ż 017B	Ĳ 0132	© 0130	đ 0111	§ 00A7
A_ 160	ă 0103	ą 0105	ć 0107	č 010D	ď 010F	ě 011B	ê 0119	ğ 011F	ĺ 013A	ľ 013E	ł 0142	ń 0144	ň 0148	ŋ 014B	ő 0151	ŕ 0155
B_ 176	ř 0159	ś 015B	š 0161	ş 015F	ť 0165	ţ 0163	ű 0171	ů 016F	ÿ 00FF	ź 017A	§ 017E	ż 017C	ĳ 0133	¡ 00A1	¿ 00BF	£ 00A3
C_ 192	À 00C0	Á 00C1	Â 00C2	Ã 00C3	Ä 00C4	Å 00C5	Æ 00C6	Ç 00C7	È 00C8	É 00C9	Ê 00CA	Ë 00CB	Ì 00CC	Í 00CD	Î 00CE	Ï 00CF
D_ 208	Ð / Đ ^[d] 00D0	Ñ 00D1	Ò 00D2	Ó 00D3	Ô 00D4	Õ 00D5	Ö 00D6	Œ 0152	Ø 00D8	Ù 00D9	Ú 00DA	Û 00DB	Ü 00DC	Ý 00DD	Þ 00DE	SS ^[e] 1E9E
E_ 224	à 00E0	á 00E1	â 00E2	ã 00E3	ä 00E4	å 00E5	æ 00E6	ç 00E7	è 00E8	é 00E9	ê 00EA	ë 00EB	ì 00EC	í 00ED	î 00EE	ï 00EF
F_ 240	ð 00F0	ñ 00F1	ò 00F2	ó 00F3	ô 00F4	õ 00F5	ö 00F6	œ 0153	ø 00F8	ù 00F9	ú 00FA	û 00FB	ü 00FC	ý 00FD	þ 00FE	ß 00DF

Letra Número Puntuación Símbolo Otro Indefinido

Notas

Los valores hexadecimales debajo de los caracteres de la tabla son los códigos de caracteres Unicode.
Los primeros 12 caracteres se utilizan a menudo como caracteres de combinación .

^ 0x18 es solo un "cero final", que se utiliza para componer ‰ o ‱ (o cantidades arbitrarias más pequeñas) a partir del signo de porcentaje (%).
^ a b La i sin puntos y la j sin puntos se pueden utilizar para componer variantes acentuadas como i con macron (ī) .
^ 0x7F es el carácter de separación de sílabas (no es realmente un guión suave).
^ 0xD0 se usa tanto como Eth (Ð, U + 00D0) como D con trazo (Đ, U + 0110) que puede ser un problema en algunas ocasiones (como copiar texto de PDF, separación de palabras, ...)
^ 0xDF contiene SS (dos letras S ). Permite a TeX convertir automáticamente la ß minúscula alemanaa la forma mayúscula.

Idiomas admitidos

La codificación es compatible con la mayoría de los idiomas europeos escritos en alfabeto latino. Las excepciones notables son:

Esperanto (usando IL3)
Lengua letona y lengua lituana (usando L7X)
Idioma galés

Los idiomas con un soporte ligeramente subóptimo incluyen:

Lengua gallega , lengua portuguesa y lengua española - debido a la falta de caracteres ª y º , que no son versiones en superíndice de la "a" y "o" minúsculas (los superíndices son más finos) y suelen estar subrayados
Lengua croata , bosnio , serbio - debido al uso compartido de la ranura para ©
Idioma turco : debido a que i sin puntos tiene diferentes combinaciones de mayúsculas y minúsculas que en otros idiomas
Idioma rumano : debido a que carecen de S y T con una coma debajo (es decir, no unidas), sin embargo, las tiene con una cedilla (unidas).

Referencias

↑ a b Petrlik, Lukas (19 de junio de 1996). "Explicación del lío de codificación de caracteres checo y eslovaco" . cs-encodings-faq . 1.10. Archivado desde el original el 21 de junio de 2016 . Consultado el 21 de junio de 2016 .
^ Ferguson, Michael (1990), "Informe sobre actividades multilingües" (PDF) , TUGboat , 11 (4): 514–516
^ Patrones de división de palabras de TeX

enlaces externos

Archivo de codificación
Descripción general de codificaciones en LaTeX

[4] 0x18 es solo un "cero final", que se utiliza para componer ‰ o ‱ (o cantidades arbitrarias más pequeñas) a partir del signo de porcentaje (%).

[ij-5] La i sin puntos y la j sin puntos se pueden utilizar para componer variantes acentuadas como i con macron (ī) .

[6] 0x7F es el carácter de separación de sílabas (no es realmente un guión suave).

[7] 0xD0 se usa tanto como Eth (Ð, U + 00D0) como D con trazo (Đ, U + 0110) que puede ser un problema en algunas ocasiones (como copiar texto de PDF, separación de palabras, ...)

[8] 0xDF contiene SS (dos letras S ). Permite a TeX convertir automáticamente la ß minúscula alemanaa la forma mayúscula.

[Petrlik_1996_CS-1] Petrlik, Lukas (19 de junio de 1996). "Explicación del lío de codificación de caracteres checo y eslovaco" . cs-encodings-faq . 1.10. Archivado desde el original el 21 de junio de 2016 . Consultado el 21 de junio de 2016 .

[Ferguson_1990-2] Ferguson, Michael (1990), "Informe sobre actividades multilingües" (PDF) , TUGboat , 11 (4): 514–516

[TeX_Hyphenation-3] Patrones de división de palabras de TeX

[1]